När vi testade Talend med Easysoft JDBC-ODBC Bridge, upplevde vi textkorruption när vi skrev icke-ASCII-data från en SQL Server-databas till en fil i CSV-format.
Lösningen var att ändra datatypen för problemkolumnen i Talend-schemat från en String
till en byte[]
. För att göra detta:
- Åtkomst till tJDBCInput-komponentens egenskaper.
- Välj knappen Redigera schema.
- Ändrade datatypsdefinitionen för den relevanta kolumnen.
Talends standardteckenkodning är UTF-8. Så länge data som returneras av en JDBC-drivrutin är ASCII, är data kodad med en annan teckenkodning inget problem:UTF-8-data som bara innehåller ASCII-tecken är identisk med data.