2010年1月17日日曜日

KGMODを使ってみた

以前の業務でWebサーバのログファイルを処理するときにはmusashiというデータマイニングツールを利用していた。久しぶりに大量データを処理する必要が出たため、musashiの後継であるKGMODを使ってみることにした。

最初に違いを感じたのは、データ形式がXMLtableからCSVに変わっていたこと。確かに、こちらのほうが手軽だか、XMLTableにはソートの結果が記録されているので、無駄なソート処理が発生しない点が気に入っていたのだが・・・。あとは引数を「f=aa,bb」と指定する事。それ以外はほぼmusashiと同じなので、特に違和感なく処理ができた。

気付いたことはWikiにまとめていく予定。

2 件のコメント:

  1. 2009年某月musashiが既にインストールしてあるマシンにこちらのインストールを試みたらmusashiのコマンドを全て上書き(mcmdへのシンボリックリンクに)されてSさん(東京都在住)が死亡した模様です。
    一方私はxtsessionの実現方法に頭を悩ませている所です。

    返信削除
  2. > Sさん(東京都在住)が死亡した模様
    ご愁傷様です。入り組んだmusashiコマンドで判読不能なスクリプトを大量に残して逃げていった前任者(埼玉県在住)を恨むべきです。

    > xtsession
    musashiにあってKGMODにないコマンドって結構あるんですよね。残念ながらmslideを駆使してがんばれとしかアドバイスできません、悪しからず。

    返信削除