TSVをCSVに変換する方法
TSVをアップロードまたは貼り付け
.tsv、.tab、タブ区切り.txtをドロップするか、タブ区切り行を直接貼り付けます。
表を確認
タブを列の境界として読み取り、出力前にプレビューを表示します。
CSVをダウンロード
.csvを保存、CSVテキストをコピー、または複数ファイルをZIPで保存できます。
TSVファイルとは
TSVファイルは表データをプレーンテキストで保存します。列はタブ文字で区切られます。形式名はTab-Separated Valuesで、多くの場合.tsv拡張子です。
TSVは研究、バイオインフォマティクス、データエンジニアリングでよく使われます。Ensembl、UCSC Genome Browser、NCBI、Galaxy、Unix系の処理では、値の中にタブが出にくい点が好まれます。
VS Codeやメモ帳で開くと、列の間が広い空白のように見えます。これは通常の空白ではなくタブです。ExcelやGoogle Sheetsに正しく取り込むと、各フィールドが別々の列に入ります。
TSVファイルの主な出所
CSVファイルとは
CSVはComma-Separated Valuesの略です。列をカンマで区切るテキスト形式で、カンマを含むフィールドは二重引用符で囲みます。
CSVは業務ツールで最も広く受け入れられるデータ形式です。Excel、Google Sheets、CRM、メール配信、BIツールで使いやすい形式です。
TSVをCSVに変換する理由
主な理由は互換性です。TSVは技術的な処理には向いていますが、表計算ソフト、CRM、マーケティングツール、インポート画面ではCSVが標準になりがちです。
PostgreSQLやMySQLのエクスポート、研究データ、バイオインフォマティクス結果、旧システムのタブ区切り.txtでよく発生します。
TSVをCSVに変換する別の方法
通常はオンライン変換が最も速いです。スクリプト、Excel、Google Sheets、ターミナルで処理したい場合は次の方法も使えます。
このオンライン変換を使う
.tsvをアップロードするかデータを貼り付けます。ツールが各行を読み、タブをカンマに変え、必要な引用符を追加します。
PythonでTSVをCSVに変換
Pythonのcsvモジュールなら、タブ、カンマ、セル内改行を安全に扱えます。
import csv
with open('input.tsv', 'r', newline='', encoding='utf-8') as tsv_in:
reader = csv.reader(tsv_in, delimiter='\t')
with open('output.csv', 'w', newline='', encoding='utf-8') as csv_out:
writer = csv.writer(csv_out)
writer.writerows(reader)ExcelでTSVを開いてCSV保存
データ取り込みでタブを区切り文字に指定し、読み込み後にCSV形式で保存します。
Google SheetsでTSVをCSVに変換
タブ区切りとしてインポートし、CSV形式でダウンロードします。
bashでTSVをCSVに変換
単純なファイルならsedで十分です。カンマを含む値がある場合はPythonを使う方が安全です。
sed 's/\t/,/g' input.tsv > output.csvTSV CSV変換が役立つ場面
表計算ソフトへ読み込む
ExcelやGoogle SheetsではCSVの方が少ない手順で開けます。
CRMへ連絡先を取り込む
HubSpot、Salesforce、MailchimpなどはCSVを求めることが多いです。
分析ツールへ渡す
Tableau、Power BI、ダッシュボードではCSVが扱いやすい形式です。
非技術者と共有する
.csvはダブルクリックで開ける可能性が高く、説明が少なく済みます。
研究データを保存する
TSVで届いたデータをCSVにしておくと、後から再利用しやすくなります。
TSVとCSVの主な違い
どちらも表データをテキストで保存します。違いは区切り文字と特殊文字の扱いです。
| 項目 | TSV | CSV |
|---|---|---|
| 区切り文字 | タブ | カンマ |
| 引用符 | 必要な場面は少ない | カンマ、引用符、改行を含むセルで必要 |
| ファイルサイズ | やや小さいことがある | 引用符が多いと少し大きくなる |
| 互換性 | データ処理、Unix、研究分野に強い | 業務ソフトで最も広く対応 |
| テキストでの見やすさ | 列が見やすいことが多い | カンマが多いと読みづらい |
TSV CSV 変換のよくある質問
タブ区切りファイルを開く、変換する、共有するときの実用的な回答です。