第五十四夜 AlpinicNightのキーワード解析

shi_moさんに紹介してもらった、id:kt-blackoutさんのところで、このサイトの解析をしてもらいました。
その名も、

Hatena::Diary解析器 茶筌!!
「ちゃせん」と読むそうです。奈良先端科学技術大学院大学自然言語処理学講座からリリースされた、フリーの日本語形態素解析器だそうです(長っ!!)
http://chasen.aist-nara.ac.jp/

元になったのがJUMAN(http://www.kc.t.u-tokyo.ac.jp/nl-resource/juman.html)というソフトだそうで・・・なんか聞いたことありますね(笑 第三十四夜 リンクのリンクのリンク 参照)。意外とこの世界狭いようです。

気長にお待ちください、と言われましたので、一時間後に見に行きました(ちょー、せっかちです)。

・・・
・・・・・・
もう終わってました。しかもアップ済みでした。(激ハヤッ)
日々の日記の増え方は「初めてのパスinイラレ」みたいな面白みのないものでしたが(私の日記のデータ量が少なすぎたようです。しかも毎日コンスタントに増えてるので普通の右肩あがりの直線にしかならなかったようで・・・)
しかしキーワードの頻出データは面白い結果になりました。

2004年03月分のキーワードデータ
http://members.jcom.home.ne.jp/j-klein/text/alpinix/2004-03.noun.txt

サイトとページが上位なのはいいとして、
活性(49)で3位
水素(37)で8位
・・
・・・
・・・・・
ふふふ意図した通りです。

id:kt-blackoutさん、ありがとうございました。