前の日 / 次の日 / 2007-05
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

2007-05-10 Thu

ソースコードがUTF-8なPerlプログラムはuse utf8

[perl]

ソースコードがUTF-8なPerlプログラムは冒頭で、

use strict;
use warnings;
use utf8;

したほうが良いよという記事を読みました。

404 Blog Not Found:perl - use utf8;
utf8 pragmaはlexical scopeなので、局所的に扱いを変える事もできる。
よってソースコードがUTF-8で書かれていたら、use strict;とuse
warnings;のすぐ下でuse utf8;と宣言しておくとよいだろう。


開発環境をわざわざUTF-8化してしているので、
今後はuse utf8したほうが良いときにはつけるようにしようっと。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

Web::Scraper

[perl]

miyagawaさんが公開した、Web::Scraperが人気です。

Web文書からデータを抽出するときにTreeを作らずに、
CSSセレクタでチチチっと読んで、該当箇所を取り出してくれます。
しかも自分でCSSセレクタを使うコードを書くよりも
単純にしてくれます。Web::Scraperいいですね。

- Journal of miyagawa (1653)
- はこべにっき# - Web::Scraper便利
- Unknown::Programming - 解析
- naoyaのはてなダイアリー - Web::Scraper

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

無料APIの6つの真実 Six Basic Truths of Free APIs

[api]

無料APIに関する興味深い記事を見つけました。

O'Reilly Radar > Six Basic Truths of Free APIs

Amazon and Google have recently shattered a common misconception:
that free APIs are a commons of goodies to be built on top of for
fun and profit, like open source software. If you think that, then
here are six things you need to know about free APIs:


日本語訳を書こうかと思いましたが、結城さんが意訳されていたので、
そちらを引用させていただきます。

www.textfile.org - Six Basic Truths of Free APIs
「フリーなAPI」についての6個の基本的な真実。以下は(かなりはしょっ
た)要点。
    * フリーなAPIを提供している企業には理由がある。
    * APIがなくならないようにするためにはお金がかかるものだ。
    * API提供者が想定していない利用法をしたら、API提供者と喧嘩する
    ことになるだろう。
    * API提供者は、そのAPIの上にあなたよりも容易に類似サービスを構
    築できるだろう。
    * だから、フリーなAPIというのはソースの貧困な代替物にすぎない。
    * だから、ビジネスを構築できるフリーなAPIなどは存在しない。"


無料で使いたければ自前でデータをもつことが大切で、
APIを使う場合は対価を支払うつもりがなければ、
結局はAPIが足を引っ張るようになる、ということですね。

手元にデータがなくて、データを取り出す取り出し口が
自分で作ったものではない場合には、
その取り出し口から出てくるものや、出て来る動作に、
ユーザが対応する必要があります。
アパートでは備え付けの水道を使っているわけですが、
たとえば超早く水が出て欲しくても、ある一定以上の
速さで水が出てくることはありません。そんなイメージ。

そのように他人に流れをコントロールされたデータは、
自らを適応させるために高い時間コストを要求します。
APIを使っていて何度もクエリを調整したりとか、っていうあれです。
APIにひきづられて自分のアプリケーションが決まる状況は
いつでも必ず避けたいです。

でも個人のプログラマにAPIを大開放してもらう対価は支払えません。
ということで、自分でデータを取得することで幸せになれる人は、
いますぐAPIを卒業するためにできることをしなきゃいけないということ
ですね。しかも、そのデータを手元で扱えるようにすべきでしょう。
#MySQLを叩けるような距離かな

なぜなら、遠隔地のデータは取得まで時間がかかるか、
内製のAPIを叩くかになってしまうので、時間が無駄になりがちだからです。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

連想検索エンジンreflexa(リフレクサ)

岡野原さんのいる会社がReflexaという名前の検索エンジンを
公開しています。

reflexa: アサマシ

関連度計算については以下のような言及がありました。

連想検索エンジン reflexa について

reflexaは、Preferred Infrastructureが提供する連想検索サービスです。
そのコアとなっている連想検索エンジンは、多くの文章を処理させること
によりエンジンがキーワード間の関連を学習します。Web上で提供してい
るサービスでは、Wikipediaエンサイクロペディアの情報を元にキーワー
ド間の関連を学習しています。


Wikipediaで深く言及されていたり、リンクに気が使われている語は
関連度が良い感じ出してくれるようですね。
関連語APIが今後公開されるそうなので、そちらも楽しみです。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

ぐるなびがWeb APIを公開

[api]

ぐるなびがWeb APIを公開しました。

ぐるなび、全国約4万件の飲食店情報をWeb APIとして公開

ぐるなびは9日、「ぐるなび」および「同 モバイル版」で提供されてい
る全国約4万件の飲食店情報を、Web APIとして公開する「ぐるなびWebサー
ビス」を10日より開始すると発表した。

 これにより、飲食店情報を発信したいと考えているポータルサイトや企
業サイト、ブログの開設者などが、ぐるなびに掲載されている飲食店情報
の一部(簡易店舗情報)が活用できるようになるとしている。


ぐるなびWebサービス

早速、APIのユーザ登録をしました。
ぐるなびはYahooなどと違い僕のユーザー情報を持っていないので、
たくさん情報を入力する必要があったのは面倒でした。

ドキュメントを読むと、ユーザが使えるクエリのバリエーションが、
食べログやよりも幅広いようです。夢が膨らみますね。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |