\xEF\xBF\xBD
är UTF-8-kodningen för unicode-tecknet U+FFFD
. Detta är ett specialtecken, även känt som "ersättningstecken". Ett citat från wikipediasidan om de speciella unicode-tecknen
:
Så det ser ut som att din datakälla innehåller skadad data. Det är också möjligt att du försöker läsa data med fel kodning. Var kommer linjerna ifrån?
Om du inte kan fixa informationen och din inmatning verkligen innehåller ogiltiga tecken, kan du bara ta bort ersättningstecken:
lines[n] = lines[n].Replace("\xFFFD", "");