2005年6月22日水曜日

Blogとネットとデータマイニング

Blogはブームとなって広がっていますが、もちろんBlogをしない人も多くいる訳で。中にはBlogを好意的に思っていない人もいる訳で。
好意的に思っていない人達がその要因として挙げるもののひとつに、サーチエンジンの問題があります。Blogって、かなり早く検索エンジンに反映されてると思うんですよね。absinthさんもBlog内でよく仰ることなんですが、Blogで書いた内容が検索エンジンに引っかかり、それが本来探していた内容と大きく掛け離れたものであるなら邪魔になってしまうのではないか。そう云った心配というか悩みはやはりあります。
何かトラブってしまって検索を掛け、その結果同様のトラブルに遭遇した内容のBlogがあればそれは助かるかもしれません。実際私もLinuxでトラブったら検索を掛けますが、Blogの記事に助けられた事もしばしばあります。
しかしながら、確かに検索ワードが含まれてはいるけれど内容的には全く関係の無いBlogの記事にも遭遇するのは事実です。そう云った場合、Blogに好意的では無い人からすると、「邪魔だ」と感じてしまうのかもしれません。その記事があるために求めるサイトにたどり着くのが遅れてしまう訳ですから。
ですが、検索エンジンで検索を掛ける場合、大抵は単語をいくつか書き並べて検索する場合がほとんどです。詳しいことが分かっていないことを調べる場合は単語数が少なく、検索件数がどえらいことになってしまうことが多々あります。それはインターネットという膨大なデータの集まりから与えられた単語で検索を掛けた結果なので致し方ありませんが、もっと効率よく検索できないものか、そう感じる人は少なくないのではないでしょうか。
Blog以外にも、古くからは掲示板があり、また個人サイトもあったりと検索ワードを含むけれど内容は余り関係ないようなサイトはたくさんあります。それらをひっくるめた中からどうやって望みのデータを捜し出すか。そのために様々な研究がなされていますが、なかなか実働にまでは至っていないのが現状です。
ぱっと思い付くのが、メタデータによる検索といったところでしょうか。そのHTMLに関連するワードをメタデータとしてファイルに保存しておき、検索の際そのメタデータと照らし合わせて検索ワードが多く含まれるようなモノを上位に持ってくる、って感じです。とはいえ、これの弱点はどのようにしてそのメタデータを作成するか、なんですよね^^; 連想する内容をデータとして保存できたらよいのですが、画像や動画が含まれる場合はどうするのか、とか、課題は多いですね。私の友人が卒業研究でこういったデータマイニングに関する研究を行うとのことなので、卒研発表が楽しみだったりします(自分も大変なのだが)。
個人的には、Blogって便利なツールだと思っています。ほとんどの人がある程度自分の書くジャンルを絞っており、また自分の得意な分野について書いているので何かを調べるときにはそう云ったジャンルのBlogからリンクをたどったりして探すこともあります。それに、普段はなかなか知る機会の無い話題も出てきたりしますし。
信頼性に関してはネットなのでとりあえず複数サイトで同一の内容になっているかは確認しますが、他の参考サイトもリンクを辿っていけば割と簡単に見付かるので時間も掛かりません。備忘録として使っている人もいますし、意外とトラブルシュートに使えるツールだと感じてます。
Blog検索も結構始まってますし、「日記」と敬遠しないで読んでみると思わぬデータに巡りあえるかもしれませんよ?

4 件のコメント:

  1. SECRET: 0
    PASS:
    データに出会うことを求めて検索して ブログにひっかかり そのままそこの常連になってしまうなんて なかなか素敵な出会いであったりもしますね^^

    返信削除
  2. SECRET: 0
    PASS:
    absinthさんこんばんは^^
    そうですね、私もBlogを始めたばっかりの時はエキブロユーザも少なかったので、エキブロのブログトップでコンピュータとニュースのカテゴリのトラバ先にちょくちょくおじゃましたものです。そこでmarubegs8さんと出会って、atuko-kさんと出会って…、と何時の間にやら常連に。そこからさらに輪が広がってabisinthさん等に広がって、今に至ってます。
    実際の生活と同じで、自分で足を伸ばして人づてなりなんなりで調べてみないと分からないこともたくさんありますものね。時間があるなら、はしごするのも楽しいものです^^

    返信削除
  3. SECRET: 0
    PASS:
    ところで、いつのまにかライフログに「FF7AC」があるのはびっくりしました!い、いつのまに?w リミットブレイクを発動したい気持ちです(謎

    返信削除
  4. SECRET: 0
    PASS:
    marubegs8さんこんばんは。
    確かに、私もBlog検索にもGoogleを使ってますねぇ…^^; ブラウザから直接調べられるのは楽ですものね。
    あ、FFVII ACは予約しましたよ〜(笑) さすがに通常の方ですが。今から発送が楽しみです♪

    返信削除