Що робити, якщо csv файл експорту не показує російські символи? Excel у CSV з кодуванням UTF8 Xls ієрогліфи.

Часто, працюючи з різними файлами у програмі "Ексель", користувач може зіткнутися з тим, що замість виразних букв буде незрозумілий шрифт, який неможливо прочитати. Виною всьому неправильне кодування. У цій статті ми поговоримо про те, як Excel змінити кодування, щоб слова можна було прочитати.

Спосіб перший: за допомогою Notepad ++

Так склалося, що змінити кодування тексту простіше в сторонній програмі, ніж у самому "Екселі". Саме тому ми зараз розглянемо спосіб, як Excel змінити кодування за допомогою програми Notepad++.

Отже, щоб правильно виконати всі дії, дотримуйтесь інструкцій:

  1. Запустіть програму "Нотпад++".
  2. Натисніть кнопку "Файл".
  3. У меню виберете "Відкрити" (також це можна зробити, натиснувши поєднання клавіш CTRL+O).
  4. У вікні провідника прокладіть шлях до потрібного файлу, кодування в якому неправильне, і натисніть кнопку "Відкрити".
  5. У файлі натисніть кнопку "Кодіювання", що знаходиться над панеллю інструментів.
  6. У меню виберіть пункт "Перетворити на UTF-8", оскільки саме це кодування програма "Ексель" сприймає на ура.
  7. Натисніть кнопку "Зберегти", що знаходиться в лівій частині панелі інструментів, та закрийте вікно програми.

Ось і все, тепер ви знаєте, як в Excel поміняти кодування одним із способів. Хоч він є найшвидшим, найзручнішим і найпростішим, але є ще інші, про які замовчати ніяк не можна.

Спосіб другий: використання "Майстра текстів"

Безпосередньо у самій програмі Microsoft Excelє також інструменти, які дозволять змінити кодування. Саме про таке і піде зараз мова, а точніше, про "Майстра текстів":

  1. Відкрийте програму "Ексель". Зверніть увагу, що її потрібно запускати не подвійним кліком по файлу, який неправильно відображається, а безпосередньо програму з порожнім листом.
  2. Перейдіть на вкладку "Дані".
  3. Натисніть кнопку "Отримання зовнішніх даних", а у випадаючому меню виберіть "З тексту".
  4. У вікні провідника вкажіть шлях до файлу, який має проблеми з кодуванням, і натисніть кнопку "Імпорт".
  5. Тепер відкриється саме вікно "Майстра текстів". У ньому необхідно змінити формат файлу, тому натисніть на однойменний і виберіть звідти "Юнікод (UTF-8)".
  6. Натисніть "Далі".
  7. Наступне вікно також пропустіть, натиснувши кнопку "Далі", всі налаштування в ньому мають стояти за замовчуванням.
  8. Тепер вам необхідно визначити формат даних стовпця файлу та відповідно до нього вибрати один із пунктів однойменного списку. За підсумком натисніть "Готово".

Після всього цього необхідно вказати найперший осередок, щоб дані помістилися на початок таблиці.

Як змінити кодування в Excel другим методом, відомо. Переходимо до третього.

Спосіб третій: збереження

Як змінити кодування в Excel? Для реалізації третього способу необхідно зробити низку таких дій:

  1. Відкрийте файл у програмі.
  2. Натисніть "Файл".
  3. Виберіть "Зберегти як".
  4. У меню виберіть розширення і натисніть "Сервіс", з випадаючого меню - "Параметри веб-документа".
  5. У вікні, перейдіть у вкладку "Кодування" і оберіть її зі списку "Зберегти документ як".
  6. Натисніть "OK".

Тепер залишається лише вказати папку, куди файл буде збережено. При подальшому відкритті текст повинен відображатися коректно.

З потребою змінювати кодування тексту часто стикаються користувачі, які працюють у браузерах, текстових редакторах і процесорах. Тим не менш, і при роботі в табличному процесорі Excel така необхідність також може виникнути, адже ця програма обробляє не лише цифри, а й текст. Давайте розберемося, як змінити кодування в Екселі.

Кодування тексту – це набір електронних цифрових виразів, які перетворюються на зрозумілі для користувача символи. Існує багато видів кодування, у кожного з яких є свої правила та мова. Вміння програми розпізнавати конкретну мову і перекладати її на зрозумілі для звичайної людини знаки (літери, цифри, інші символи) визначає, чи додаток зможе працювати з конкретним текстом чи ні. Серед популярних текстових кодувань слід виділити такі:

  • Windows-1251;
  • KOI-8;
  • ASCII;
  • ANSI;
  • UKS-2;
  • UTF-8 (Юнікод).

Останнє найменування є найпоширенішим серед кодувань у світі, оскільки вважається свого роду універсальним стандартом.

Найчастіше програма сама розпізнає кодування і автоматично перемикається на неї, але в окремих випадках користувачеві потрібно вказати додатку її вигляд. Тільки тоді він зможе коректно працювати з кодованими символами.

Найбільша кількість проблем з розшифровкою кодування у програми Excelзустрічається при спробі відкриття файлів CSV або експорті файлів txt. Часто замість звичайних букв при відкритті цих файлів через Ексель ми можемо спостерігати незрозумілі символи, так звані «кракозябри». У цих випадках користувачеві потрібно зробити певні маніпуляції для того, щоб програма почала коректно відображати дані. Існує кілька способів вирішення цієї проблеми.

Спосіб 1: зміна кодування за допомогою Notepad++

На жаль, повноцінного інструменту, який дозволяв би швидко змінювати кодування в будь-якому типі текстів Ексель немає. Тому доводиться з цією метою використовувати багатокрокові рішення або вдаватися до допомоги сторонніх додатків. Одним із найнадійніших способів є використання текстового редактора Notepad++.


Незважаючи на те, що цей спосіб заснований на використанні стороннього програмного забезпечення, він є одним із самих простих варіантівдля перекодування вмісту файлів під Ексель.

Спосіб 2: застосування Майстра текстів

Крім того, зробити перетворення можна і за допомогою вбудованих інструментів програми, а саме Майстра текстів. Як не дивно, використання цього інструменту дещо складніше, ніж застосування сторонньої програми, описаної в попередньому методі.


Спосіб 3: збереження файлу у певному кодуванні

Буває й обернена ситуація, коли файл потрібно не відкрити з коректним відображенням даних, а зберегти у встановленому кодуванні. В Екселі можна виконати і це завдання.


Документ збережеться на жорсткому диску або знімному носії в кодуванні, яке ви визначили самі. Але потрібно врахувати, що тепер документи, збережені в Excel, завжди зберігатимуться в даному кодуванні. Для того, щоб змінити це, доведеться знову заходити у вікно "Параметри веб-документа"та змінювати налаштування.

Існує й інший шлях зміни параметрів кодування збереженого тексту.

CSV(Comma Separated Values) – поширений формат для зберігання табличних даних (числових та текстових) у вигляді простого тексту. Цей формат файлів популярний і живучи завдяки тому, що величезна кількість програм і програм розуміють CSV, хоча б як альтернативний варіантфайлового формату для імпорту/експорту. Більше того, формат CSV дозволяє користувачеві заглянути у файл і негайно знайти проблему з даними, якщо така є, змінити роздільник CSV, правила цитування тощо. Це можливо тому, що CSV – це простий текст, і навіть не дуже досвідчений користувач зможе легко його зрозуміти без спеціальної підготовки.

У цій статті ми вивчимо швидкі та ефективні способиекспорту даних з Excel на CSV і дізнаємося, як перетворити файл Excel на CSV, зберігши без спотворень всі спеціальні та іноземні символи. Описані у статті прийоми працюють у всіх версіях Excel 2013, 2010 та 2007.

Як перетворити файл Excel на CSV

Якщо потрібно експортувати файл Excel до будь-якої іншої програми, наприклад, до адресної книги Outlook або до бази. даних Access, попередньо перетворіть Excel у файл CSV, а потім імпортуйте файл .csvв іншу програму. Нижче дано покрокове керівництво, як експортувати робочу книгу Excelу формат CSV за допомогою інструменту Excel – « Зберегти як».

Примітка:Усі згадані формати зберігають лише активний аркуш Excel.


Експортуємо з Excel у CSV з кодуванням UTF-8 або UTF-16

Якщо на аркуші Excel містяться спеціальні або іноземні символи (тильда, наголос і подібні) або ієрогліфи, то перетворення аркуша Excel у CSV описаним вище способом не спрацює.

Справа в тому, що команда Зберегти як > CSV(Save as > CSV) спотворить всі символи, крім ASCII (American Standard Code for Information Interchange). І якщо на листі Excel є парні лапки або довгі тире (перенесені до Excel, наприклад, з документа Wordпри копіюванні / вставці тексту) – такі символи також будуть пошматовані.

  • UTF-8– це компактніше кодування, що використовує для кожного символу від 1 до 4 байт. Найчастіше рекомендується використовувати цей формат, коли символи ASCII переважають у файлі, т.к. більшість таких символів потребує 1 байт пам'яті. Ще одна перевага в тому, що кодування файлу UTF-8, що містить лише символи ASCII, нічим не відрізнятиметься від такого ж файлу ASCII.
  • UTF-16використовує від 2 до 4 б для зберігання кожного символу. Зауважте, що не завжди файл UTF-16 потребує більше місця в пам'яті, ніж файл UTF-8. Наприклад, японські символи займають від 3 до 4 байт у UTF-8 і від 2 до 4 байт у UTF-16. Таким чином, є сенс використовувати UTF-16, якщо дані містять азіатські символи, зокрема Японські, Китайські та Корейські. Істотний недолік цього кодування в тому, що вона не повністю сумісна з файлами ASCII і потрібні спеціальні програмидля відображення таких файлів. Пам'ятайте про це, якщо плануєте імпортувати файли з Excel кудись ще.

Як перетворити файл Excel на CSV UTF-8

Припустимо, ми маємо лист Excel з іноземними символами, у нашому прикладі – це японські імена.

Щоб експортувати цей лист Excel у файл CSV, зберігши при цьому всі ієрогліфи, зробимо таке:


Примітка:Не всі прості текстові редактори повністю підтримують символи Юнікод, тому деякі можуть відображатися як прямокутники. У більшості випадків, це ніяк не вплине на підсумковий файл, і можна просто не звертати на цю увагу або вибрати редактор, наприклад, Notepad++.

  1. Так як у нашому текстовому Юнікод файлі як роздільники використовується символ табуляції, а ми хочемо перетворити його в CSV (розділювачі - коми), то необхідно замінити символи табуляції на коми.

Примітка:Якщо немає суворої необхідності отримати файл саме з роздільниками - комами, а потрібен будь-який файл CSV, який Excel зможе зрозуміти, цей крок можна пропустити, так як Microsoft Excel відмінно розуміє файли з роздільником - табуляцією.

Примітка:Якщо файл призначений для використання за межами Excel і формат UTF-8 є обов'язковою вимогою, то не робіть на аркуші жодних змін і не зберігайте його знову в Excel, оскільки це може призвести до проблем з читанням кодування. Якщо якась частина даних не відображається в Excel, відкрийте той же файл у Блокноті і внесіть виправлення до даних. Не забудьте зберегти файл у форматі UTF-8.

Як перетворити файл Excel на CSV UTF-16

Експортувати файл CSV UTF-16 набагато швидше і простіше, ніж у UTF-8. Справа в тому, що Excel автоматично застосовує формат UTF-16 при збереженні файлу як Текст Юнікод(Unicode Text).

Для цього зберігаємо файл за допомогою інструмента Зберегти як(Save as) в Excel і потім Провіднику Windowsзмінюємо розширення створеного файлу на .csv. Готово!

Якщо файл CSV з комою або крапкою з комою потрібен як роздільник, замініть всі символи табуляції на коми або точки з комою відповідно в Блокноті або в будь-якому іншому текстовому редакторіна свій вибір (раніше у цій статті є докладна інструкція, як це робиться).

Інші способи перетворення файлів Excel у CSV

Описані вище способи експорту даних з Excel CSV (UTF-8 і UTF-16) універсальні, тобто. підійдуть для роботи з будь-якими спеціальними символами та в будь-якій версії Excel від 2003 до 2013 року.

Існує безліч інших способів перетворення даних з формату Excel CSV. На відміну від наведених вище рішень, ці способи не будуть давати в результаті чистий UTF-8 файл (це не стосується , який вміє експортувати файли Excel в кілька варіантів кодування UTF). Але в більшості випадків файл, що вийшов, буде містити правильний набірсимволів, який можна безболісно перетворити на формат UTF-8 за допомогою будь-якого текстового редактора.

Перетворюємо файл Excel на CSV за допомогою Таблиць Google

Як виявилося, можна дуже просто перетворити файл Excel на CSV за допомогою Таблиць Google. За умови, що на комп'ютері вже встановлено програму Google Drive , виконайте такі 5 простих кроків:

Порада:Якщо файл Excel відносно невеликий, то для економії часу можна перенести дані в таблицю Google за допомогою копіювання / вставки.


На завершення відкрийте створений файл CSV у будь-якому текстовому редакторі, щоб переконатися, що всі символи збережені правильно. На жаль, файли CSV, створені в такий спосіб, не завжди правильно відображаються в Excel.

Зберігаємо файл.xlsx як.xls і потім перетворюємо на файл CSV

Для цього способу не потрібні будь-які додаткові коментарі, оскільки з назви вже все ясно.

Це рішення я знайшов на одному з форумів, присвячених Excelу, вже не пам'ятаю, на якому саме. Чесно кажучи, я ніколи не використовував цей спосіб, але, за відгуками безлічі користувачів, деякі спеціальні символи губляться, якщо зберігати безпосередньо з .xlsxв .csvале залишаються, якщо спочатку .xlsxзберегти як .xls, а потім як .csv, як ми .

Так чи інакше, спробуйте самі такий спосіб створення файлів CSV з Excel, і якщо вийде, це буде хороша економія часу.

Зберігаємо файл Excel як CSV за допомогою OpenOffice

OpenOffice – це пакет програм з відкритим вихідним кодом, включає додаток для роботи з таблицями, яке відмінно справляється із завданням експорту даних з формату Excel в CSV. Насправді, ця програма надає доступ до більшому числупараметрів під час перетворення таблиць у файли CSV (кодування, роздільники тощо), ніж Excel і Google Sheets разом узяті.

Просто відкриваємо файл Excel у OpenOffice Calc, натискаємо Файл > Зберегти як(File > Save as) та вибираємо тип файлу Текст CSV(Text CSV).

На наступному кроці пропонується вибрати значення параметрів Кодування(Character sets) та Розділювач поля(Field delimiter). Зрозуміло, якщо ми хочемо створити файл CSV UTF-8 із комами як роздільники, то вибираємо UTF-8і вписуємо кому (,) у відповідних полях. Параметр Розділювач тексту(Text delimiter) зазвичай залишають без зміни – лапки (“). Далі натискаємо ОК.

Так само для швидкого і безболісного перетворення з Excel в CSV можна використовувати ще одну програму – LibreOffice. Погодьтеся, було б чудово, якби Microsoft Excel надав можливість налаштовувати параметри при створенні файлів CSV.

У цій статті я розповів про відомі мені способи перетворення файлів Excel у CSV. Якщо Вам знайомі більше ефективні методиекспорту з Excel до CSV, розкажіть про це у коментарях. Дякую за увагу!

Файли та документи, створені на комп'ютері, завжди мають кодування. Часто трапляється так, що при обміні файлами або завантаженні їх з інтернету кодування, в якому вони створені, не читається нашим комп'ютером. Причини цього можуть бути різні - як відсутність необхідного кодування в програмі, якою ми хочемо відкрити файл, так і відсутність деяких компонентів програми ( додаткового пакетушрифтів, наприклад).

Нижче розглянемо, як змінити кодування файлу чи документа, що не читається, в різних програмах.

Зміна кодування на сторінці браузера

Для Google Chrome

  1. Вибираємо меню «Параметри» → «Інструменти».
  2. Рядок "Кодування" - наводимо мишею, і з'являється список можливих кодувань у браузері.
  3. Вибираємо для російських сайтів "Windows 1251". Якщо не допоможе, пробуємо «Автоматично».

Для Opera

  1. Натискаємо «Opera» → «Налаштування»
  2. Зліва меню «Веб-сайти» → поле 2 «Відображення» → «Налаштувати шрифти»
  3. У полі «Кодування» вибираємо «Кирилиця (Windows 1251)».

Для Firefox

  1. Firefox → Установки → Вміст.
  2. Навпроти рядка «За замовчуванням шрифт» натискаємо кнопку «Додатково».
  3. Внизу вікна вибираємо "Кодування" &rarr "Кирилиця (Windows 1251)".

Зміна кодування у Word

Розглянемо процедуру зміни кодування на прикладі Word 2010

  1. Відкриваємо документ.
  2. Вкладка "Файл" → "Параметри".
  3. Вибираємо рядок "Додатково". У розділі "Загальні" навпроти рядка "Підтверджувати перетворення формату файлу при відкритті" ставимо галочку. Натискаємо ОК.
  4. Далі відкриється вікно "Перетворення файлу". Вибираємо "Кодований текст", тиснемо ОК.
  5. Далі у вікні відзначаємо «Інше» і вибираємо зі списку кодування, яке відобразить необхідний текст. У вікні «Зразок» можна переглянути, як відображається текст у тому чи іншому кодуванні, яке ви вибрали.

Якщо пройдена процедура не допомогла відобразити документ, можна спробувати змінити шрифт. Іноді документ може відображатися у вигляді «квадратиків» або інших знаків, якщо програма не має відповідного шрифту.

Зміна кодування в Excel

Розглянемо процедуру зміни кодування для Excel 93-2004 та 2007:

  1. Відкриваємо документ, що не читається, за допомогою програми Notepad++.
  2. Вибираємо меню Encoding (Кодування) → Конвертувати в UTF-8.
  3. Символи не зміняться, зміниться лише кодування внизу екрана. Далі вибираємо набір символів. Якщо це російська мова: Encoding → Character sets → Cyrillic → Windows-1251.
  4. Натискаємо "Зберегти". Відкриваємо файл у Excel. Якщо текст не читається, пробуємо повторити кроки 3-4.

Зміна кодування тексту

  1. Відкриваємо файл у стандартному текстовому процесорі Блокнот.
  2. Натискаємо "Зберегти як".
  3. У вікні збереження, що відкрилося, вибираємо місце, куди хочемо зберегти файл, тип документа - текстовий, а також ставимо інший тип кодування.
  4. Зберегти.
  5. Пробуємо відкрити документ.

Додатково читайте статтю

У мене є файл Excel, який має деякі іспанські символи(Тільди і т. д.), що мені потрібно перетворити на файл CSV для використання як файл імпорту. Однак, коли я зберігаю як CSV, він спотворює "спеціальні" іспанські символи, які не є символами ASCII. Здається, що це також відбувається з лівими та правими лапками та довгими тире, які, здається, походять від вихідного користувача, що створює файл Excel у Mac.

оскільки CSV - це просто текстовий файл, я впевнений, що він може обробляти UTF8 кодування, тому я припускаючи, що це обмеження Excel, але я шукаю спосіб отримати з Excel в CSV і зберегти символи, відмінні від ASCII.

30 відповідей

Примітка: будьте обережні з конфіденційними даними з листів Google.

після збереження CSV під Excel в командному рядкуставимо:

Iconv -f cp1250 -t utf-8 file-encoded-cp1250.csv > file-encoded-utf8.csv

(Не забудьте замінити CP1250 вашим кодуванням).

працює швидко і відмінно підходить для великих файлів, таких як база даних поштових кодів, які не можуть бути імпортовані в GoogleDocs (межа 400 000 осередків).

передбачаючи середовище Windows, збережіть і працюйте з файлом, як завжди, в Excel, але потім відкрийте збережений файл Excel у Gnome Gnumeric (безкоштовно). Збережіть таблицю Gnome Gnumeric як CSV, яка для мене в будь-якому випадку зберігає її як UTF-8 CSV.

простий спосіб зробити це: скачати open office (), завантажте електронну таблицюта відкрийте файл excel (.xls або .xlsx). Потім просто збережіть його як текстовий CSV-файл, і відкриється вікно з проханням зберегти поточний формат або зберегти як формат ODF. виберіть "Зберегти поточний формат" і в новому вікні виберіть варіант, який працює краще для вас, відповідно до мови, якою написаний ваш файл. Для іспанської мови виберіть Західна Європа (Windows-1252/WinLatin 1) і файл працює лише штраф. Якщо вибрати Unicode (UTF-8), він не працюватиме з іспанськими персонажами.

Я також зіткнувся з такою самою проблемою, але для цього є просте рішення.

  1. Відкрийте файл xlsx в Excel 2016 або вище.
  2. У "Зберегти як" виберіть цю опцію: "(CSV UTF-8 (з роздільниками комами)*.csv)"

Він працює відмінно, і створюється файл CSV, який можна імпортувати в будь-яке програмне забезпечення. Я імпортував цей csv-файл до своєї бази даних SQLITE, і він чудово працює з усіма символами unicode.

Я написав невеликий скрипт Python, який може експортувати листи до UTF-8.

вам просто потрібно надати файл Excel як перший параметр, а потім листи, які ви хочете експортувати. Якщо аркуші не надані, сценарій експортує всі аркуші, які є у файлі Excel.

#!/usr/bin/env python # export data sheets from xlsx to csv from openpyxl import load_workbook import csv from os import sys reload(sys) sys.setdefaultencoding("utf-8") def get_all_sheets(excel_filework): s = load_workbook(excel_file,use_iterators=True,data_only=True) all_worksheets = workbook.get_sheet_names() для worksheet_name в all_worksheets: sheets.append(worksheet_name) return sheets def csv (excel_file,use_iterators=True ,data_only=True) для worksheet_name в листах: print("Export" + worksheet_name + "...") try: worksheet = workbook.get_sheet_by_name(worksheet_name) except KeyError: print("Could not find "+ works. (1) your_csv_file = open("".join(), "wb") wr = csv.writer(your_csv_file, quoting=csv.QUOTE_ALL) для ряду в worksheet.iter_rows(): = = = = cell in row: lrow. append(cell.value) wr.writerow(lrow) print(" ... done") your_csv_file.close() if not 2<= len(sys.argv) <= 3: print("Call with " + sys.argv + " ") sys.exit(1) else: sheets = if len(sys.argv) == 3: sheets = list(sys.argv.split(",")) else: sheets = get_all_sheets(sys.argv) assert( sheets != None and len(sheets) > 0) csv_from_excel(sys.argv, sheets)