【Python】ライブラリ「Pandas」で「C error」解決!エクセルのカラムエラー


Pythonで、CSVファイルから、エクセル(elsx)へデータを出力する際、カラムエラーが発生したので対応した時のまとめをしておきます。

「Pandas」ライブラリを使用した際に今回のようなエラーが発生した際は参考にしてください。

【Pandas】でカラムエラーが発生した際の対応まとめ

今回、CSVファイルを読み込んで、中身のデータをエクセル(xlsx)に書き込むプログラムを作成しました。

import pandas as pd

# CSVファイルの読み込み
data = pd.read_csv('file_out.csv', encoding='cp932')

# Excel形式で出力
data.to_excel('excel-data.xlsx', encoding='utf-8')

print('CSV > Excel変換完了')

このプログラムを実行すると以下のようなエラーが発生しました。

Traceback (most recent call last):
  File "ssh_test_6.py", line 40, in <module>
    data = pd.read_csv('file_out.csv')
  File "C:Users\0003563AppDataLocalProgramsPythonPython38-32libsite-packagespandasioparsers.py", line 685, in parser_f
    return _read(filepath_or_buffer, kwds)
  File "C:Users\0003563AppDataLocalProgramsPythonPython38-32libsite-packagespandasioparsers.py", line 463, in _read
    data = parser.read(nrows)
  File "C:Users\0003563AppDataLocalProgramsPythonPython38-32libsite-packagespandasioparsers.py", line 1154, in read
    ret = self._engine.read(nrows)
  File "C:Users\0003563AppDataLocalProgramsPythonPython38-32libsite-packagespandasioparsers.py", line 2059, in read
    data = self._reader.read(nrows)
  File "pandas/_libs/parsers.pyx", line 881, in pandas._libs.parsers.TextReader.read
  File "pandas/_libs/parsers.pyx", line 896, in pandas._libs.parsers.TextReader._read_low_memory
  File "pandas/_libs/parsers.pyx", line 950, in pandas._libs.parsers.TextReader._read_rows
  File "pandas/_libs/parsers.pyx", line 937, in pandas._libs.parsers.TextReader._tokenize_rows
  File "pandas/_libs/parsers.pyx", line 2132, in pandas._libs.parsers.raise_parser_error
pandas.errors.ParserError: Error tokenizing data. C error: Expected 10 fields in line 19, saw 49

17行目で「C error」、カラム(Column)に関するエラーが発生しました。
色々と調べるとどうも列をうまく読み込めていないことにより、うまくエクセルにデータを貼り付けることができていないようです。

CSVを読み込む際に「カラム(Column)」名を指名する

エラーの問題は、CSVのカラムが読み込めないので、明示的にカラム名を作成して読み込ませることで、エラーを回避することができました。

以下が設定の例となります。

# CSVファイルの読み込み
col_names = ['c{0:02d}'.format(i) for i in range(100)]
data = pd.read_csv('file_out.csv', encoding="shift-jis", names = col_names)

エンコーディングの「sift-jis」は以下でも問題ないです。

data = pd.read_csv('file_out.csv', encoding='cp932', names = col_names)

詳細は以下の記事を確認ください。

【Python】UnicodeDecodeError: が発生した際の対処法

2020年2月9日


対応後のプログラム

CSVの読み込みの際、カラム名を指名するプログラム全体は以下のようになります。

import pandas as pd

# CSVファイルの読み込み
col_names = ['c{0:02d}'.format(i) for i in range(100)]
data = pd.read_csv('file_out.csv', encoding='cp932', names = col_names)

# Excel形式で出力
data.to_excel('excel-data.xlsx', encoding='utf-8')

print('CSV > Excel変換完了')

実行後、以下のようにエクセルにデータが出力されていることを確認できます。

列にカラム名「c0x」が表示され、正常にデータが出力されています。


関連記事


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

ABOUTこの記事をかいた人

blank

インターネット関連のSEをやっています。 ネットワーク、サーバー、ストレージ、仮想基盤まで幅広く手を出しており、MVNOの構築経験もあります。 現在は、Pythonを使ったプログラミングの開発をしネットワークの自動化ツールを作成しています! Pythonの入門書も作成しているので、ぜひ参考にしてください!