Atsushi2022の日記

データエンジニアリングに関連する記事を投稿してます

BigQueryの外部テーブルでの allow_quoted_newlines オプション

BigQueryの外部テーブルでの allow_quoted_newlines オプション

BigQuery で CSV ファイルから外部テーブルを作成する場合は、オプションが不足していないか確認してください。

ある日、元の CSV ファイルのフィールドの 1 つに引用符で囲まれた改行文字が含まれているために、外部テーブルによるクエリが失敗したことに気づきました。

このような場合、エラーを避けるために allow_quoted_newlines オプションを使用する必要があります。

以下は、allow_quoted_newlines オプションを使用したクエリの例です。

CREATE OR REPLACE EXTERNAL TABLE example_dataset.example_table (
  id INT64,
  name STRING,
) OPTIONS (
   format = 'CSV'
  ,uris = ['gs://example_bucket/example.csv']
  ,skip_leading_rows = 1
  ,allow_quoted_newlines = True
);

Reference

cloud.google.com

English version

github.com