TOP 投稿 過去ログ 管理用 RSS RDF

[LogParser]CSV形式の入力を扱う場合。

URL:http://bit.ly/gxAUxJ
「LogParser」ではCSV形式のデータにも対応しています。CSV形式を扱う場合、コマンドラインでCSV形式(-i:CSV)を指定し、CSV用のパラメータで扱いを決めます。

クエリのFROMにはCSVファイルを指定する必要がありますが、ワイルドカード(*.csv)で指定したり、ファイルへのパスはカンマ(,)で区切ることで複数指定できます。またURLを指定したり、標準入力(STDIN)を与えることも出来ます。

扱うことの出来るフィールド名はCSVファイルの内容とパラメータによって変わりますが、FilenameとRowNumberは固定です。Filenameは解析中のファイルの完全なパス名が参照できます。RowNumberは解析中のファイルの行数が参照できます。

「headerRow」パラメータがONの場合、CSVファイルの最初の1行目がフィールド名として扱われます。

「iHeaderFile」パラメータはヘッダー用のファイルを指定できます。ヘッダーファイルの1行目が解析されフィールド名として扱われます。
抽出されたフィールド名が実際より少ない場合、残りのフィールドには「FieldN」で扱われます。Nはそのフィールドのインデックス番号です。

「fixedFields」パラメータがONの場合、CSVファイルのフィールド数は固定で扱われます。

「nFields」パラメータでフィールド数を指定します。-1を指定するとCSVファイルを解析しフィールド数を決めます。

「dtLines」パラメータは、CSVファイルのフィールド数とフィールドの型を決めるための解析を何行目まで調査するかを指定します。規定値では10です。値が0の場合解析は行われずすべての値はSTRING型となります。

「iDQuotes」パラメータが規定値(Auto)の場合、フィールド値が二重引用符(")で囲まれている場合、次の二重引用符(") までをカンマ(,)を無視してフィールド値とします。二重引用符を処理しない場合は「Ignore」を指定します。

「nSkipLines」パラメータはCSVファイルの先頭から何行スキップするかを指定します。ヘッダーの解析もスキップされた後から行われます。

「comment」パラメータはCSVファイルのコメント行としてみなす開始文字を指定します。指定した文字で始まっている行はスキップされます。

「iCodepage」パラメータは文字コードを指定します。規定値(0)の場合システムの既定コードです。-1の場合UNICODEで扱われます。

「iTsFormat」パラメータは日付または時刻として扱われる形式を指定します。指定した形式に一致したフィールド値はTIMESTAMP型のデータとなります。形式⇒タイムスタンプ書式指定子

「iCheckpoint」パラメータはチェックポイント情報のファイルを指定します。前回の実行時に生成されたチェックポイント情報を与えることで増分のみを処理します。

Log Parser 2.2 日本語版
「LogParser」でログの解析・集計!PCのイベントログやIISのアクセスログに対応