前の日 / 次の日 / 2007-04
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

2007-04-23 Mon

美しいBlogosphere 思わず見とれたリンク解析結果の画像

[blog][sns]

思わず見とれてしまったので記事にすることにした。

ソーシャルメディアの専門家Matthew Hurst氏が
最近6週間分のリンクデータを収集し、Blogosphereの最もアクティブかつ
相互結合している地域を描画したそうです。

画像

画像の緑のリンクは単方向のリンク(ブログA --> ブログB)をあらわし、
青のリンクは相互リンクをあらわします(ブログA <--> ブログB)。

これはやばい。15分くらい見とれてしまった。
もっと大きい画像で、さらにグニグニ動いてたらもっと感動してたかも。

Map: Welcome to the Blogosphere

The blogosphere is the most explosive social network you’ll never
see. Recent studies suggest that nearly 60 million blogs exist
online, and about 175,000 more crop up daily (that’s about 2 every
second). Even though the vast majority of blogs are either
abandoned or isolated, many bloggers like to link to other Web
sites. These links allow analysts to track trends in blogs and
identify the most popular topics of data exchange. Social media
expert Matthew Hurst recently collected link data for six weeks
and produced this plot of the most active and interconnected parts
of the blogosphere.


blogosphereは最も爆発的なソーシャルネットワークで、
最近の研究では、ネット上には6000万近いブログが存在し、
さらに1日に17万5千個以上増えているそうです。
つまり、ブログは1秒につき2個づつ増えてるということです。
多くのブロガーは他のWebサイトにリンクを張ることが好きなのにも関わ
らず、圧倒的多数のブログは放棄・隔離されているかです。

これらのリンクはアナリストにブログにおけるトレンド追跡や、データ交
換の最も人気のある話題の同定をさせてくれます。

画像中の各点が何を表しているか


1、MR. POPULARITY - DailyKos

DailyKosには50万人近くの人がアクセスするそうです。
まさに世界で最も有名なブログの1つといえます。
2、THE GOSSIP OF GADGET HOUNDS - Boing Boing

明るいこの点は、ガジェットやハイテク系のゴシップを扱うBoing Boing。
3、SHOW ME YOUR FRIENDS - LiveJournal

この隔離されたエリアはLiveJournal.com
LiveJournalはソーシャルネットワークサービス(SNS)として運営されている。
ブログ界からのリンクは、このブログの孤島まで届かない。
などなど(以下略)


みたいなことが書いてあったけど、大半の人はブログの孤島で暮らしてい
て、大半のブログは悲しく打ち捨てられていくことを考えると、
たまーにでもリンクしてもらえる自分は結構幸せかもと思ったりしました。

▼関連記事
[O] 米大学乱射事件に見るブログとマスコミの関係

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

Ajaxでポジネガ判定 「Sentiment Analysis - demo」がバージョンアップ

乾さんの、「Sentiment Analysis - demo」がAjax対応になりました。
このサイトでは、文章中の単語の極性を判定できます。
APIも公開しています。

Sentiment Analysis - demo

研究を実装して公開することは、すばらしいことですね。尊敬。

▼関連記事
[O] PN単語辞書 - 単語感情極性対応表

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

SVN::TracWiki - Tracでパワポを検索できるようにするスクリプト

mizzyさんがSVN::TracWikiをリリースしました。

mizzy.org - SVN::TracWiki #0

SVN::TracWikiというツールをつくってみました。svn repos はこちら。
何をするものかというと、Subversion の post-commit スクリプトとして
動作して、コミットされたファイルからテキストを抽出、そのファイルの
実体へのリンクを付加して、Trac の Wiki へ自動ポストするというもの。


File::Extractで対応しているファイル形式なら何もしなくても
テキスト抽出してくれて、Tracで検索できるそうです。
これは良いですね。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

Railsで複数DBを使い分けるためのライブラリ magic_multi_connections

[ruby]

「magic_multi_connections」というRailsで複数DBを使い分けるためのラ
イブラリについて、まとめている記事がありました。

Twitterのトラブルから見る、DB分割でスケーラブルなRailsサイト構築:TKMR.blog.show

最近、2.0な方々の間でTwitterが話題になってる。で、そのTwitter自体
も面白いんだけど、TwitterについてDHHがブログを書いてRailsでの大規
模サイト構築が話題になってるのが面白い。


基本一つのDBを見るRailsを、複数DBを使えるようにできるようです。
さらに、acts_as_readonlyableという同じように複数DBを使うための
ライブラリについても言及されていました。そのうち使うと思うのでメモ。

[2007-04-27]:追記
この話題に対する言及を見かけました。

みかログ: DBの分散方法
2種類のモジュールがあるようだけど,readonlyable 方式はすぐ問題が
出てきそうな気がする.
たとえば,ユーザ登録時にIDの重複判定をするような場合,read_only 指
定をしていると,masterからslaveへの更新反映が遅延するため,正しく
重複判定出来ない可能性が出てしまいそう.
かといって,read_only 指定をしないと,アクセスが多そうなユーザ情報
のテーブルが分散されない.
その辺を考えると,多少面倒でも magic_multi_connections のやり方が
正解じゃないのかなぁ,と思う.


なるほど、やっぱり用途しだいということですかね。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

Nine Inch NailsのCDに隠された秘密のコード

[idea]

Nine Inch Nailsのニューアルバム「Year Zero」の盤面には、
秘密が隠されているみたいです。

その秘密はともかく僕が良いなと思ったのは、
一回使うとCDの色が変わるところ。

Nine Inch Nails - Year Zero


sta la sta - Nine Inch NailsのCDに隠された秘密のコード

購入された方はお気づきでしょうが、上のイメージのようにこのCDは真っ
黒に着色されたものです。
ですが、一度PCでCDを一通り再生後に取り出してみると、なんとCDの色が
真っ白(イメージの下のCD)に変化しているではありませんか!
どうやら温度に反応して色が変わる仕掛けのようですね。私もMacで再生
後に取り出してみて確認したところ、ホントにCDが白色に変わっていまし
た。


「一回、しかも一定時間使うと、最初に戻ったときに変化がある」という
アイディアはいろいろなことに活かせそうだと思ったのでした。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

Encode::find_encoding()の使い方

[perl]

弾さんがEncode::find_encoding()の使い方を解説していました。

404 Blog Not Found:perl tips - Encodeを速く使う方法

Encodeでは文字コード名の名前解決もしているからだ。sjisも
Shift_JIS"も同じに扱うためには、当然なんらかの形でこれらが同じで
あることを判定しなければならない。それを担うのが、
Encode::find_encoding()だ。
実はこのEncode::find_encoding()、返すのは正規化された名前ではなく
オブジェクトである。そして、実のところこのオブジェクトこそが実際の
(en|de)codeを行うtranscoderなのである。よって最適解は、以下のとお
りとなる。

my $enc = find_encoding("Shift_JIS");
for my $i (0..0xffff) {
    $enc->encode($str);
}


こんなに速いとは知らなかったです。以後使えるときは使います。

▼関連記事
[O] HTTP::Response::Encoding

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

Web Designing誌主催 WD Live! 株式会社はてなと考えるにっぽんのWeb2.0

Web Designing誌主催 WD Live! 株式会社はてなと考えるにっぽんの
Web2.0というイベントのレポートが上がっています。
伊藤直也さんのプレゼンに関するメモだけの場合が多いです。

- inasphere blog-はてな伊藤直也さんのセミナーに行ってきた
- 脱・下流エンジニア (仮) - はてなと考えるにっぽんのWeb2.0
- とあるプログラマーの平凡な日記: WD Live!セミナーに行ってきた
- WD Live!セミナーレポート+α : guyberとNancyとringo134と

一人で開発する。他とかぶっても最初は気にしない。早く作る。
どうせ最初は何も起きないから心配しない。とか、
いいことが書いてあります。

一人で開発する場合には、開発しているものを周りの人間が理解できる
必要がありますよね。多くのWebサービスの場合はそれが可能なので、
一人開発できるということでしょうか。純粋な開発よりではなく
研究よりの開発だと一人開発は悲惨なことになりがちだなと思いました。

▼関連記事
[O] CSS Nite Shuffleレポ

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

SafariのJavaScriptデバッガ「Drosera」が便利

Safari用のJavaScriptデバッガにDroseraというのがありますが、
その導入と簡単な使い方に関する説明が公開されていました。

SafariのJavaScriptデバッガ「Drosera」を使ってみる。

MacOSXのSafariに対応するときは、UTF-8の処理が他のブラウザと違うの
にデバッグ環境がなかったため、開発には苦労してきたと思います。
そんな中最近(といっても半年以上前)、「Drosera」という、
Safari(正確にはWebKit)のデバッガが登場しました。


すぐbizの開発時はSafariのデバッガがなくてデバッ
グに非常に難儀しました。特に、UTF-8周りで、Safariだけ文字化けする
とか、BOMの問題だとか、AJAXのレスポンスだけ文字化けするとかという
問題に遭遇していたのですが、そのときにDroseraを使っていれば、すぐ
に原因特定と解決ができたよなあと思い出にふけってしまいました。


デバッガが見つからないために後回しにされたり未対応扱いになったりで、
かわいそうなことになりがちなSafariですが、Droseraでデバッグすれば
コストの削減ができそうですね。

▼関連記事
- [O] 効率的なJavaScriptのTips EfficientJavaScript

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

検索エンジンのリンク解釈に関する2つの理解されにくい問題

[seo]

検索エンジンのリンク解釈について2つの解説がありました。

検索エンジンのリンク解釈に関する2つの理解されにくい問題

ページとドメイン名へのリンク

質の高い信用のある情報源から得たリンクは、おなじドメイン名の多くの
ページの順位を引き上げる。これは、検索エンジンがリンクを単一ページ
への支持票として数えるだけでなく、ドメイン名全体への支持票としても
数えるからなんだ。
そのため、僕がよく「Wikipedia要因」と呼ぶ効果が働く。この呼び名は、
Wikipediaのページで、外部からの被リンクがなく、Wikipedia内のページ
から1つか2つリンクがあるだけなのにもかかわらず、よく使われる検索キー
ワードで上位5番目までに入ることから付けたものだ。


一時的リンク分析

表示順位をめぐる競争が激しい分野の多くでは、上位ランクを得るのに必
要な数の被リンクを獲得するだけでは十分じゃない。長期にわたって自分
のドメイン名にリンクを誘い続ける必要もある。
被リンクのパターンに着目すれば、ずっと前からある退屈なサイトが、
毎月4~5件のペースで新しいリンクを獲得しているのに対し、
新興サイトが1日4~5件のペースで被リンクを獲得していることに気づくだろう。
総リンク数2000でも30日間に90リンクのペースで増えている新興サイトの
ランクは上がる。総リンク数8000でも30日間に5リンクのペースでしか増
えていない古いサイトのランクは変わらない。


上の記事の要点は以下の2点に絞られる。

サイトの検索順位をあげるTips


質の高い信用のある情報源からリンクを得よう

自分のサイトで、質の高い信用のある情報源からリンクを得るために、
何ができるのかを考えて実行しよう。どこかのページにリンクをもらえば、
サイト全体にそのリンクの効果は波及する。
フレッシュなリンクを稼ぐこと

フレッシュなリンクを稼ぐこと。サイトの人気は総獲得リンク数を増やす
より、いかに1ヶ月以内に張られたリンクを増やすかを考えるべき。

論文では結構前に見られた問題設定だと感じました。
着実に理論が実装されているので、すごいな、と思いました。
今後はページの有益さをクローラーにアピールする方法を
考える時代が来るってことですかね。

▼関連記事
- [O] AmazonのURLにUTF-8文字が入っている理由

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |

効率的なJavaScriptのTips EfficientJavaScript

結城さんが、EfficientJavaScriptを公開していた。

EfficientJavaScript - Dev.Opera - 効率的な JavaScript

ウェブアプリケーションをできるだけ速く動かすための, 簡単な工夫が
ある. ループの書き方を変える, スタイルの変更は三回やらず一回にまと
める, 実際に使うスクリプトだけを追加する, など.
この記事では, そうした簡単な変更をいくつか紹介する.


JavaScriptの効率化を図る際のキッカケに丁度良さそう。

投稿者:としのり  日時:23:59:59 | パーマリンク | コメント | トラックバック() |