前の月 / 次の月 / トップページ
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

2007-08-19 Sun

FirefoxでLDRを使う際に、ポップアップブロックに「ギーッ」となったら変える設定

FirefoxでLDRを見てるときにショートカット「o」を使っていると、
ポップアップブロックのために気持ちよくウィンドウを開けない
時があります。

ウィンドウ数かメモリ量を見ているのかなと思って、
ググってみたら、あっというまに解決策が見つかりました。

We Ain't Seen Nothin' Yet. : firefox + LDR でポップアップブロックを解除できないときの対処法

原因
原因は firefox 自体の設定でポップアップ数の最大値を決めており,
それ以上のポップアップは許可サイトであってもポップアップできないと
いう仕様のためでした.

解決法
そこで,解決策は firefox の詳細設定のためのページをロケーションバー
に about:config と入力して開き,
dom.popup_maximum という値を変更することです.


設定したらポップアップブロックに邪魔されませんでした。幸せ。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

2007-08-06 Mon

日本語意味解析製品「なずき」、か

[nlp]

日本語意味解析製品「なずき」というアプリケーションに関する
解説が乗っかっていたので、興味を持って記事を読んでみました。

世界初のモバイル向けコンテンツ連動型広告開始 @IT

今回のサービスでは、徳島大学発のベンチャー企業、言語理解研究所と
NTTデータが共同開発した日本語意味解析製品「なずき」を用いたことで、
精度の高いマッチングが可能になった。


でも、記事からは残念ながら「なずき」の魅力があまり分かりませんでした。

なずきは、概念辞書や連想知識、感性情報といった文章の意味についての
高度な分析を行う辞書データベースを持つ言語処理エンジンで、例えば
「私の彼って、最近車買ったんだよぉ? 明日は軽井沢へ連れて行ってく
れるんだぁ」という文章から、旅行、宿泊、自動車に関連した広告を表示
させることができる。


この記事で言及していることは、意味を解析しなくても実現できます。
大人気無いですが、実際に一緒にやってみましょう。

@ITの記事と同じような処理を実際にやってみよう


プログラムするまでもないので、手を動かして遊んでみます。
入出力

入力 : 私の彼って、最近車買ったんだよぉ? 明日は軽井沢へ連れて行ってくれるんだぁ
出力 : 旅行、宿泊、自動車
つかうもの

- Chasen(WindowsのGUI版でOK)
 ChaSen's Wiki - 茶筌の配布
- Yahoo!検索
1、Chasenで名詞を抽出

「私の彼って、最近車買ったんだよぉ? 明日は軽井沢へ連れて行ってく
れるんだぁ」を文分割する必要もないので、そのままChasenで解析。
形態素解析の結果として、基本形と品詞を表示しています。

私 私 名詞-代名詞-一般
の の 助詞-連体化
彼 彼 名詞-代名詞-一般
って って 助詞-格助詞-連語
、 、 記号-読点
最近 最近 名詞-副詞可能
車 車 名詞-接尾-一般
買っ 買う 動詞-自立
た た 助動詞
ん ん 名詞-非自立-一般
だ だ 助動詞
よ よ 助詞-終助詞
ぉ ぉ 未知語
? ? 記号-一般
明日 明日 名詞-副詞可能
は は 助詞-係助詞
軽井沢 軽井沢 名詞-固有名詞-地域-一般
へ へ 助詞-格助詞-一般
連れ 連れる 動詞-自立
て て 助詞-接続助詞
行っ 行く 動詞-非自立
て て 助詞-接続助詞
くれる くれる 動詞-非自立
ん ん 名詞-非自立-一般
だ だ 助動詞
ぁ ぁ 未知語
EOS


ここから名詞だけを抽出します。

私 私 名詞-代名詞-一般
彼 彼 名詞-代名詞-一般
最近 最近 名詞-副詞可能
車 車 名詞-接尾-一般
ん ん 名詞-非自立-一般
ぉ ぉ 未知語
明日 明日 名詞-副詞可能
軽井沢 軽井沢 名詞-固有名詞-地域-一般
ん ん 名詞-非自立-一般
ぁ ぁ 未知語


2、簡単なストップワード処理

この手の処理にストップワード処理は必須です。
結果を確認しながら、より汎用性の高いルールを探して、
ストップワードのフィルタリングに使いましょう。
今回は、以下の3ルールを使います。

- 代名詞はストップワード
- ひらがな、カタカナ、英数字1文字はストップワード
- 名詞-副詞可能はストップワード

その結果は以下の通りです。

車 車 名詞-接尾-一般
軽井沢 軽井沢 名詞-固有名詞-地域-一般


3、関連語検索をする

「車」、「軽井沢」というキーワードが取得できたので、
これらを使ってYahoo!検索の関連語を確認します。
ページ下部に関連語リストが出現しますよ。

Yahoo!検索 - 軽井沢
軽井沢 アウトレット, 軽井沢プリンスホテル, 軽井沢 ホテル, 軽井沢プ
リンス, 軽井沢 ペンション, 軽井沢 観光, 軽井沢 宿泊, 旧軽井沢,
軽井沢 おもちゃ王国, 星のや 軽井沢 で検索


整頓してみると、以下のようになります。

・軽井沢の関連ワード
-アウトレット
-プリンスホテル
-ホテル
-プリンス
-ペンション
-観光
-宿泊
-旧軽井沢
-おもちゃ王国
-星のや

4、最後に関連語から一般的な語を選択する

これらのキーワードのなかで、より一般的なキーワードは、
「観光」と「宿泊」です。
検索エンジンのヒット数を目安にしてもよいですし、
関連ワードをもう一度Chasenにかけてフィルタリングしても良いでしょう。
自動車も「車」というキーワードで同じようにすれば見つかりますよ。




なづきについて知りたくなったので調べてみると、
以下のような記事を見つけました。

「スーパーなずき」の最適化開発・展開について NTTデータ
「スーパーなずき」では、「なずき」のみが持つ特徴的な自然言語理解機
能のうち、以下について最適化および機能強化を行います。
1. 従来の形態素解析や構文解析による単語や文法情報抽出に加えて、意
味情報を抽出できる最先端技術「不連続ノード同時評価型A*アルゴリズム」
による日本語意味解析処理の高速化
2. 「話題分野」「意図予測分野」「感性理解」などの複合的な意味属性
を効率的に理解できる最先端技術「多属性意味照合システム」の精度強化
および高速化
3. 意味共起解析基本辞書(8,000万パターン・220万語)、概念知識辞書
(4,000概念・100万語)、話題分野知識辞書(981分類・70万語)、感性
理解知識辞書(360億パターン)、固有表現知識辞書(23万語)、広告関
連知識辞書(43万語、50億パターン)の規模拡張に加え、広告関連固有表
現辞書(10万語)・CGM関連知識辞書(60億パターン)の新規開発
4. コンテンツ・ユーザー動向・広告クリエイティブ内容を分析・照合し
最適な広告情報を抽出する「志向性マッチングシステム」の最適化


ふむふむ。この辞書は素晴らしそうですね。
自分ではとても作れない巨大な辞書です。
巨大な辞書とNLPツールと検索エンジンの組み合わせが
なずきという製品なのかな。正直ネットでは良くわかりませんでした。

なんというか、意味解析って何かと難しいですね。
意味解析、という言葉がカッコよいだけに色々ありそう。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

2007-08-05 Sun

2007-08-04 Sat

ニコニコ動画のマイリストがRSS対応になっていた

ニコニコ動画のマイリストがRSS対応になっていたという、
個人的に衝撃のエントリが開発者ブログにあがっていました。
しかも1週間前には対応していたということです。

実は追加されている機能について - ニコニコ動画 開発者ブログ

マイリストなのですが、1週間ほどまえにRSS対応となりました。
お気に入りのひとのマイリストに追加があった場合にRSSで取得できると
とても便利ですが、ほとんど使っていただけていません!


すいません。全然気がつきませんでした。沢山見てたのになー。

マイリストのRSS対応すばらしいと思います!

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

PHPカンファレンス2007

PHPカンファレンス2007が開催されるそうです。
PHPを愛している人は見逃さないで行くと良さそうです。

参加費は無料のようです。おお。
事前登録必須のようなので急いで登録しましょう。

『PHPカンファレンス2007』開催のご案内
日本PHPユーザ会は、毎年「PHPカンファレンス」を開催しております。

9月1日(土)10:00-17:00(09:30開場)
18:00より懇親会を行います(希望者のみ、約2時間)
会場 大田区産業プラザ(PiO) 2F 小展示場、6F C会議室
住所 大田区南蒲田1-20-20
参加費 無料(懇親会は会費3000円程度を予定)


ちなみに僕は行きません。当日は数学を勉強していると思います。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

PythonによるBlog&News本文領域抽出ツール extbody

PythonによるBlog&News本文領域抽出ツール extbody が公開されました。
はてブの人気ページに対する本文抽出精度が8割だったとか。なるほど。

extbody -- Blog&News本文領域抽出ツール
http://tanashi.s240.xrea.com/extbody/

extbody -- PythonによるBlog&News本文領域抽出ツール

Pythonで、BlogやニュースのWEBページから、本文領域のHTMLを抽出する
ツール extbody -- Blog&News本文領域抽出ツール を作りましたので公開
します。


実際にコードを眺めてみると、アルゴリズムは意外と簡単。
エンコードしたり、HTMLから不要部分を削除したあとで、
所定のタグ領域に含まれるテキストを「.。、? \ ?!!」のような
区切り文字で行分割し、行数が多くなった領域を取得する
仕組みになっているような感じました。

日本語の本文抽出には区切り文字がよく効くということですね。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

iPhone風のUIを作ることができるJavascript「iUI.js」

iPhone風のUIを作ることができるJavascriptライブラリ「iUI.js」が
面白そうです。導入も簡単そうなので試してみたいと思ってます。

iUI Music Demo
http://joehewitt.com/iui/music.html#_home

「iPhone」風UIを実現するJavascript「iUI.js」 :skuare.net

今回はJoeHewitt.comのiUIで紹介されている、iPhone的なUIを実現する
javascript「iUI.js」を紹介します。


使いどころは難しそうですけれど、いい動きをしますねー。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

8月24日にお台場でビール党が開催

8月24日はビール党だそうですよ。

切込隊長BLOG(ブログ): 【ビール党】8月24日、お台場でビール党を開催予定!!

詳細は後ほど。


ビール党ってTech系なのか疑問だけど、
oobaさんが居るんじゃないかと思うので、ま、いいか。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

mixiのアクティブ率が低下しているそうだ

[mixi]

mixiの2006年に入会した550万人のアクティブ率が低下しているそうです。
mixiは2004年にエンジニアとデザイナーを中心に、ばーっと広がった
印象があります。

当時はmixiのような楽しい雰囲気のSNSは無かったですね。
一方、2006年に入会した人はmixi以外の選択肢がある状態で、
mixiを始めた人なのかもしれませんね。

Broadband Watch編集部ブログ: 気になる「mixi」のアクティブ率低下

気になる「mixi」のアクティブ率低下 [ ブログ・SNS ]  7月31日に開催
されたミクシィの決算説明会では、mixiのアクティブ率が減少傾向にある
ことが明かされました。  3日以内にログインするアクティブ率は約64%
から約62%へと減少しており、これまで7割を誇っていたmixiのアクティ
ブ率も減少傾向が伺える。 mixi決算、会員が1,000万を突破。アバターや
ゲームの導入も検討
http://bb.watch.impress.co.jp/cda/news/18991.html  アクティブ率の
減少については「注目度の高かった2006年に入会したユーザーのアクティ
ブ率が低い」との説明がありましたが、注目が高いだけにその年に入会し
たユーザー比率も非常に高そう。ということで過去の発表から2006年に入
会したユーザー数を算出してみました。  2006年1月1日時点でのユーザー
数は、プレスリリースによると2,238,000人。また、2006年12月31日のユー
ザー数は決算説明会の場で約744万人との説明がありました。ここから計
算すると2006年に入会したユーザー数は約550万人。2007年末の会員数最
新値が1,110万人ですから、ほぼ半分に相当する会員数です。


mixiは日記コンテンツの質が良いので、まだまだ楽しいことができそうです。
これからのサービス充実に期待ですね。

ちなみに僕はmixiに3日に1回くらいログインしています。
一方、twitterとwassrとnowaは1日に数回リロードしていますよ。
個人的にはmixiにも気楽さが実装されると嬉しいです。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

2007-08-03 Fri

USTREAM.TV を楽しむための mystream

USTREAM.TV を楽しむためには自分好みの Viewer を(見つける|作る)のが良さげ。
最近気に入って使っているのは clouder さんのmystream

画像

Clouder::Blogger: ustream のために mystream を作った

みんな公開しているliveを自分用に一つにまとめたい!と思いました。
自分だけで使うなら素にHTMLで書けばいいんですが、せっかくなのでみん
なが使えるようにということでmystreamというのを作りました。動作確認
はFirefoxでしかやっていません。


mystream
http://mystream.47objects.com/

これは良いですよ。僕は好き。
追加した各要素をドラッグできるのが素晴らしいですね。

再度アクセスしたときに、cookie を使って前回見てたユーザを
開いてくれるのも良いです。さすが。

わがままを言うと、スライダーの位置を記憶してくれたり、
クリックした要素を一番手前に表示してくれると、さらに嬉しいっす。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

デスクトップを録画してFlashムービーにできる「JING」

JING というデスクトップを録画して Flash ムービーを作ることができる
アプリが人気のようですよ。
キャプチャーと配信の両方に対応しているそうです。
映像として切り抜く部分を範囲指定できるのは素敵ですね。

MOONGIFT: » Flashムービー形式でデスクトップ録画「JING」:オープンソースを毎日紹介

JINGはMac OSX、Windowsに対応している。指定範囲のスクリーンキャプチャ
はもちろん、指定範囲でのスクリーンキャストにも対応している。録画さ
れた内容は音声付でFlashムービー形式で保存される。


JINGを使うと作成した動画に文字や矢印を記述できるようです。
Winkみたいに使うことができるようですね。
作ったflvファイルを任意の Viewer でみたり YouTube にアップできるのが
魅力なようです。なるほど。今度使ってみようっと。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

リクルートWEBサービス

[api]

リクルートが自社で提供するAPIを一元化するためなのか、
リクルートWEBサービスを公開しています。

リクルートWEBサービス

リクルート、保有データベースのAPIを一挙公開

リクルートは8月1日、リクルートが保有するデータベースを利用するため
のAPIを一括提供するサイト「リクルートWEBサービス」を公開した。同時
に、これまで未公開であった「エイビーロード」「リクルート進学ネット」
「赤すぐnet」「ホットペッパーBeauty」の4つのAPIも提供開始された。
 リクルートは今回APIの提供を1つのサイトに一元化することで、外部サー
ビス運営者の利便性を高め、APIの利用促進を図る。
じゃらんnetやホットペッパー.jpなどすでに公開済みのAPIも2007年度中
にリクルートWEBサービスに移行する予定だ。
これによりAPI利用時に必要な認証機能などがリクルート全社で一元化す
ることになる


確かにインパクトはありますね。でも個人的には意味を感じられませんでした。

APIを利用する際の手間が省けそうで良さそうに見えるけれど、
同一IDによる検索回数制限や、同一IPからの検索回数制限が導入されたときに、
ユーザからすると利便性が下がるなーと思いました。
利用規約もなんというか何ですね。はー。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

2007-08-02 Thu

富士フイルム シソーラスに基づく関連画像検索エンジン 「TRIPIT」

[nlp][search]

富士フイルムが、独自開発のシソーラスに基づくクエリ拡張を使った
関連画像検索エンジン「TRIPIT」を公開しました。
Web APIも同時に公開されているので使ってみると面白そうですよ。

TRIPIT
http://labs.tripit.jp/

TRIPITとは、画像に付けられた「ことば」(タグやタイトル)に関連のある
画像を検索することができる「関連画像検索エンジン」です。


TRIPITによる検索は、ユーザがクエリを与えることで始まります。
クエリを与えるとTRIPITは、クエリの「上位語」「下位語」や
「同位語(同じ上位語を持つ語)」をシソーラス中から探します。
そして、それらの語をタグとして画像検索を行い結果を返します。

例えば「花」というタグのついた画像をキーにして関連画像検索を行うと、
   * 上位の意味を持つ「植物」のタグがついた画像
   * 下位の意味を持つ「チューリップ」「あじさい」のタグがついた画像
   * 並列の意味を持つ「ガーデニング」「鳥」のタグがついた画像
などを検索結果として得ることができます。


肝心なシソーラスはサーバードメイン社と富士フイルムの共同開発だとか。
実質サーバードメイン社が発注を受けて構築したか、
自社のシソーラスを提供したか、どちらかではないでしょうか。
シソーラスの自動拡張を実装しているみたいなので、おもしろいですね。

シソーラス構築時の上位・下位語の計算にはWikipediaを(も?)使ったそうです。
ちょっと頑張れば軽いシソーラスは誰でも作れるということですね。
精度を向上するためには、いろいろ課題はあるでしょうけど。

こういうものを富士フィルムが出したということは、
現代の技術では画像を使って画像を検索することが困難であることを
示唆している気がして、ちょっと寂しくなったのでした。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

未踏ソフトウェア創造事業:2007年第Ⅱ期未踏ソフト公募結果発表

[未踏]

少し前に未踏ソフトウェア創造事業の2007年第Ⅱ期未踏ソフト公募結果が
発表されていました。

ネット界隈では、吉本敏洋さんの「グーグル八分発見システムの開発」に
対する言及が多いように感じました。来年のIPAXでキラキラしているのは
どのテーマでしょうか。楽しみですね。

未踏ソフトウェア創造事業:2007年第Ⅱ期未踏ソフト公募結果

未踏ソフトウェア創造事業 採択プロジェクト一覧

David J. Farber PM 応募数:1件 採択数:1件
1 斉藤 賢爾
Development and Application of Global Operating System Shell

ウィリアム 齋藤 PM 応募数:9件 採択数:2件
1 佐々木 和志
携帯電話上の仮想ソケットシステムによる認証・ファイルシステム
2 扇  裕和
IDベース暗号をもとに構成した公開鍵によるデータ共有システムの開発

大川 恵子 PM 応募数:16件 採択数:2件
1 杉江 崇繁
動的再構成可能ハードウェアと汎用モジュールの開発
2 渡辺 知恵美
日本語話者と学習者を巻き込むFolksonomy型オノマトペ用例辞典の開発

河野 恭之 PM 応募数:29件 採択数:6件
1 門脇 さくら
表情空間チャートの生成と表情表出リズムの可視化ツールの開発
2 吉田 一星
ソーシャルメモサイト、「メモジャ」の開発
3 岩渕 絵里子
電脳化粧鏡の開発
4 斎藤 幸士
ソーシャル・マークアップ・サービス、eLABELの開発
5 出口 博章
数式の二次元構造を直感的に扱うためのシステムの開発
6 福本 麻子
音楽で絵画を融合するメディアプレイヤーの開発

美馬 義亮 PM 応募数:39件 採択数:4件
1 飯田 一博
3次元音楽創出のための立体音響ソフトウェア群の開発
2 松川 昌平
トポロジカルな関係性を構築する建築設計支援ソフトウェアの開発
3 森田  尚
高品質な書籍を簡単に制作するための出版支援ソフトウェアの実用化
4 黒田 哲司
仮想秘書サービス基盤の構築

石川 裕 PM 応募数:18件 採択数:3件
1 井上  剛
Web分散コンピューティングによる株価分析ソフトの開発
2 田中 浩一
業務アプリケーション開発用途向けWhat記述指向言語の開発
3 荒川  傑
開発現場の「掟」を代行するJavaコンパイラIrenkaの開発

竹田 正幸 PM 応募数:15件 採択数:1件
1 阿部 正佳
実装言語独立でモジュラリティーの良いコンパイラキット SCK

田中 二郎 PM 応募数:41件 採択数:4件
1 松本 義秀
オフラインで利用可能なセキュア・オンラインストレージの開発
2 吉本 敏洋
グーグル八分発見システムの開発
3 田中 泰生
日常生活における、重要でない事柄への意思決定支援システム
4 村上 友樹
ユビキタス環境技術を用いた超越体験メディアの開発

畑 慎也 PM 応募数:39件 採択数:3件
1 五十嶋 さやか
Smoothie ローカルポータルによるファイル管理機構
2 林  良生
オンラインストレージを利用するJavaScript用データベースの開発
3 平山 宗介
RSS Collaborator for Windows Mobileの開発

古川 享 PM 応募数:15件 採択数:0件
採択案件はありません。

松原 健二 PM 応募数:15件 採択数:4件
1 平山 直紀
オンラインゲームのセキュアなログイン認証
2 牧野 浩之
Tailでつながっテイル ~興味マッチングシステム~
3 吉野 圭一
汎用型フォースフィードバックコントローラの開発
4 常田 和人
鍵盤楽器を使った音楽ゲーム開発支援システム『ブラボー』の開発


切れたタイトルが無いのに、終ってみるとスゴイのが現れるんですよね。
未踏に出す人はすごいなー。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

ブログを書こう

[ログ]

どもども。ここ1ヶ月ほど研究へのアウトプットを多くしていました。
で、1ヶ月くらいしたら入出力のバランスが崩れてきてグダグダに。
やはり、ブログを書かないとダメですね。

今回はちょっと反省してブログの記事を書く時間を、
どれくらい確保すればよいかを計算してみました。

計算の結果「寝る前の2時間が明けばブログを書いたほうが得」という
結果がでました。毎日コツコツですよね。

あと、こっちの技術ブログの記事は意外とよくGoogleが拾ってくれるので、
僕が記事を書くことで、僕の好きなものが少しでも目立つと嬉しいな、と
思ったりしたのも、今回の再開のモチベーションになっています。

こっちの技術ブログも、もう片方の日記ブログが日記になるまでに
経たような試行錯誤を経て、だんだん芸風が出てくると思いますよ。ええ。

個人的には少しTech系のイベント情報を集めてまとめてみようと思います。
自分が参加できるイベントを見逃したくないので。;)。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

2007-08-01 Wed

BlogScouterを花束王子が軽くdis

BlogScouterというブログの影響力を測定するサービスを、
milanoさんが軽くdisっていて、いろいろ考えちゃいました。

Milano::Monolog: BlogScouterが3段階制かもしれない疑問

BlogScouterが3段階制かもしれない疑問 BlogScouter(ブログスカウター)
を導入してはや3週間が過ぎ、スカウターの値が89で安定していた今日こ
の頃、さっき確認したら55に下がってました。
(中略)
値が下がったのは月が替わってなにかのカウントがリセットされたからか
もしれないので別に文句はないのですが、これだけの数のブログを見ても
30と55しかないってのはいかがなものかと思うよ。 プログラマがヘボで
計算ロジックがミスってるのかな。だといいけど。
3段階制だと貼ってても意味ないしつまらないから、この画像に変えちゃ
おうかな。


ブログを評価する難しさと、ヘボプログラマのレッテルを貼られる怖さを
感じてしまいました。

それにしても3段階は酷すぎますね。
量子化するにしても、もう少し軽くやってあげればよいのに。
ユーザは0.01ポイント数字が上下するだけで一喜一憂するものですよ。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |