4 posts tagged “web2.0”
第21回人工知能学会全国大会(JSAI2007)
近未来チャレンジ(サバイバル・オブ・チャレンジ)セッション
「Community Webプラットフォーム -ブログ・SNS・ソーシャルウェアの未来形-」
論文募集
主催:社団法人 人工知能学会
期日:2007年6月18日(月)〜6月22日(金)
場所:ワールドコンベンションセンターサミット(宮崎市)
オーガナイザー:
大向 一輝(国立情報学研究所)
松尾 豊 (産業技術総合研究所・スタンフォード大学)
松村 真宏(大阪大学大学院)
福原 知宏(東京大学)
武田 英明(国立情報学研究所・東京大学)
申込方法:
詳細は全国大会のページをご覧ください。申込はこちらから。
申込締切:2007年1月22日(月)14:00
投稿締切:2007年4月16日(月)14:00
※申込時には研究内容と将来の見込み・課題について200〜300字程度のアブストラクトを提出してください。また、発表カテゴリは「サバイバル・オブ・チャレンジ3:Community Webプラットフォーム」を選択してください。※現在、全国大会のページおよび申込サイトにおいて「Community Webプラットフォーム」に関する記載がないようです。修正を依頼中ですので、申込希望の方はいましばらくお待ちください。
発表方式:
受理された論文は「サバイバル・オブ・チャレンジ」セッションで口頭発表(発表15分・質疑5分)していただきます。また、セッションの全体について、参加者のみなさまから次年度のセッションの継続の可否についての評価をいただきます。
Community Webプラットフォームについて
背景と目的
現在のWebは、これまでの「巨大な辞書」という役割だけではなく、個人間のコミュニケーションの基盤としての機能を持っています。とくに、ブログやソーシャルネットワーキングサービス(SNS)の普及によって、個人が記名性あるいは自己同一性を持ちながら他者とコミュニケーションを行うことが容易になりました。すでに、海外では数億人以上、国内でも1千万を超えるユーザがこういったサービスを日常的に利用するようになり、今後もその数は増加するものと思われます。また、ユーザの増加にともなって、Web上で流通する情報量も飛躍的に増大しています。
このような状況の中で、人工知能研究の対象である情報・知識・コミュニティといったものが質・量ともに大きく変わっています。個人の持つ主観的な情報が容易に発信できるようになり、個人同士のつながりが可視化されるようになったことで、それらの集積による「コミュニティに支えられた知識」の姿が見えるようになるのではないかと期待されています。また、ここで得られた知識は、将来的にはエージェントや、エージェントの活動の場であるセマンティックWebに生かすことが可能であると思われます。
近未来チャレンジ「Community Webプラットフォーム」セッションでは、変化し続けるWebを、個人-コミュニティ-情報-知識といった視点から研究し、議論する場を提供したいと思います。現在Webの分野で活発に研究を行っておられる皆様のご投稿をお待ちしています。
研究テーマ
「Community Webプラットフォーム」では、知識共有や社会ネットワーク分析、セマンティックウェブなど、幅広い領域を対象としています。下記テーマ以外にも、Webやコミュニティに関する研究を広く募集します。
知識共有システム
ブログ
SNS
ソーシャルタギング
フォークソノミー
実世界情報の利用
コミュニケーション分析
キーワード抽出
キーパーソン抽出
ソーシャルネットワーク抽出
ネットワーク分析
スモールワールド
スケールフリーネットワーク
セマンティックウェブ
オントロジー
メタデータ
トラスト
ウェブアプリケーション
インターフェイス
その他
過去の論文・発表
JSAI2006のセッションでは22件の発表がありました。概要・PDFは下記ページで読むことができます。
セッション1:社会関係を利用したCreation/Presence(4件)
セッション2:トピック・属性・関係の工学的分析(5件)
セッション3:実践と社会学的分析(3件)・アクセスコントロール(4件)
セッション4:関係構造処理(6件)
提案者の論文・発表
大向一輝, 松尾豊, 松村真宏, 武田英明: Community Webプラットフォーム, 人工知能学会論文誌, Vol.21, No.3, pp.251-256 (2006).
大向一輝, 松尾豊, 松村真宏, 武田英明: Community Webプラットフォーム, 人工知能学会全国大会(第19回)論文集 (2005).
大向一輝, 松尾豊, 松村真宏, 武田英明: Community Webプラットフォームの実現に向けて, 人工知能学会全国大会(第20回)論文集 (2006).
本論文は非公式バージョンです。学術論文へ引用される場合には、必ず「人工知能学会誌」2006年7月号掲載の論文をご参照ください。(大向一輝, 武田英明, 松尾豊: リアルワールドとしてのWeb, 人工知能学会誌, Vol.21, No.4, pp.403-409, 2006.)
----
リアルワールドとしてのWeb
Web as a Real World
大向一輝(国立情報学研究所 / 総合研究大学院大学)
Ikki Ohmukai, National Institute of Informatics / The Graduate University for Advanced Studies
武田英明(国立情報学研究所 / 東京大学)
Hideaki Takeda, National Institute of Informatics / University of Tokyo
松尾豊(産業技術総合研究所 / スタンフォード大学)
Yutaka Matsuo, National Institute of Advanced Industrial Science and Technology / Stanford University
Abstract
インターネット接続環境の進歩によるユーザの増加、ならびにブログやソーシャルネットワーキングサービス(SNS)といった個人中心型メディアの発達によって、コミュニケーションの場としてのWebは現実世界の人間関係を色濃く反映するものとなった。また、地理情報サービス(GIS)や携帯電話がWebと接続されるなど、日常生活を情報技術によって支援するための基盤が整いつつある。ここでは、現実世界とWebは別個のものではなく、融合し、互いに補完し合う関係が形成されている。本稿では、いくつかの研究を挙げ、このようなWebの現状について報告し、今後進むべき方向性について議論する。
In recent years the Web changes into a projection of "real world" with growing connected people and rapid diffusion of personal media such as Blogs and Social Networking Services. Integration of the Web, cellphones and geographical information systems will be an infrastructure for supporting everyday life. Now the Web and real world are inseparable, and they complement each other. In this paper we describe current situation of the Web as a real world with several researches and discuss our future direction.
1. はじめに
インターネット接続環境の進歩によるユーザの増加、ならびにブログやソーシャルネットワーキングサービス(SNS)といった個人中心型メディアの発達によって、コミュニケーションの場としてのWebは現実世界の人間関係を色濃く反映するものとなった。また、地理情報サービス(GIS)や携帯電話がWebと接続されるなど、日常生活を情報技術によって支援するための基盤整備が進んでいる。ここでは、現実世界とWebは別個のものではなく、融合し、互いに補完し合う関係が形成されている。本稿では、いくつかの研究を取り上げ、変化を遂げつつあるWebの現状について報告し、今後進むべき方向性について議論する。
2. サイバースペースとリアルワールド
現在、Webはコミュニケーションのツールとして広く利用されているが、コンピュータネットワークをコミュニケーションの場として明確に位置づけたのはSF小説が最初だと言われている。SF作家William Gibsonは、1984年に刊行された代表作「Neuromancer」において、ネットワーク上に構築された仮想空間をサイバースペースと呼び、サイバースペース上で物理的な制約を超えた情報収集や、他者とのコミュニケーションを行う人々の姿を描いた。
サイバースペースという概念の登場によって、我々は複数の世界で生活しうることが示されるとともに、いまある現実世界はサイバースペースとの対比として「仮想でない世界」すなわち「リアルワールド」として再定義された。
その後数年間、サイバースペースは想像上の産物でしかなかったが、折からのインターネットの普及によって、地縁・血縁ではなく、純粋に興味や関心によって形成されたバーチャルコミュニティが生まれ、サイバースペースの現実性やそれがリアルワールドに与える影響が議論されるようになった[1]。
ただし、この時点での議論では、サイバースペースとリアルワールドはあくまでも別個のものであり、それぞれのコミュニティは別の人間関係によって形成されていることが自明であると考えられていた。
しかしながら、2000年前後を境にインターネットの常時接続環境が整備され、インターネットを利用するユーザが爆発的に増加した結果、リアルワールドにおけるコミュニティーのメンバーがサイバースペースに進出するようになると、サイバースペースはリアルワールドを補完するものとして機能しはじめた。また、サイバースペース上のコミュニティがオフラインミーティングによってリアル化するなど、両者の境界は曖昧になっている。
さらには、2004年前後から急速に普及が進んでいるブログならびにSNSによって、各個人が容易にWebサイトを構築・運営することが可能になった。そして、このWebサイトを一種のエージェントと見なし、非同期的に個人間のコミュニケーションを行うことが常態になりつつある。こういったコミュニケーションは既存の社会関係が反映されたものであると考えられるが、これがサイバースペース上のコミュニティに帰着するのか、リアルワールドに属するものであるのかを区分することは実質的に不可能である。
Webの普及によって膨大な情報空間へのアクセスが可能となった一方で、そのために必要なインターネット接続環境についても飛躍的な進歩が見られる。ハード面においてはPCやデバイスの小型・高速化、ネットワークインフラとしてはPHSやWifi、広域無線通信などの技術開発が進められてきた結果、モバイルPCや携帯電話によるインターネット接続が実現し、情報空間へのアクセスに関して時間的および空間的な制約がなくなりつつある。さらには、接続時における時間情報や、デバイス付属のGPS機能によって取得された空間情報を、情報検索あるいはコミュニケーションに利用するといった新たな技術が生まれている。また、これまでにユビキタスコンピューティングの実現に向けて研究されてきた諸技術が、Webを介することで急速に結びつきを強めている。
このように、Webのリアルワールド化は、大別すると個人を取り巻く社会関係をWebに対応させる取り組みと、その個人が物理的にどのような状態で存在しているかをWebにマッピングする取り組みの2方向で進められている。本稿では、前者に関する研究を「実社会とWeb」、後者を「実世界とWeb」と呼び、この2つの切り口からサイバースペースとリアルワールドの融合事例を紹介する。また、実社会性と実世界性を兼ね備えたWeb研究についても触れ、このような研究を推進するにあたって必要となる技術的要素や、解決すべき課題、今後の展開について議論する。
3. 実社会とWeb
社会学では、個人間の関係をネットワークとして捉え、これを分析して知見を得る社会ネットワーク分析という研究分野が古くから存在する。社会ネットワーク分析を行うためには、分析対象となる人間関係を把握する必要があるが、暗黙的に存在する人間関係を明示化するためにはアンケート調査等を行わねばならず、その規模は比較的小さなものにとどまっていた。
しかしながら、実社会における人々の活動の結果がWebに反映されるようになったことで、Webから大規模な社会ネットワークを抽出することが可能になった。また、SNSのように、明示的に人間関係を扱うサービスが普及し、人々に受け入れられつつある。
近年では、このようにして得られた大規模社会ネットワークに対する分析が進められるとともに、分析結果をもとにした情報推薦や、社会関係の推薦といった応用研究が数多く提案されている。ここでは、社会ネットワークに関連する研究を構築・抽出・分析・応用の4種類に分類し、それぞれについて事例を挙げる。
3.1. ネットワークの構築
ブログ間のリンク・トラックバック関係や、SNSにおける友人関係は、明示的に形成された社会ネットワークとみなすことができる。これらのデータはクローラー等によって容易に取得することができるため、社会ネットワーク分析の基礎データとして多く用いられている。2006年5月に行われるブログ研究のワークショップでは、ブログ検索エンジンBlogPulseより100万サイト・1000万記事からなるデータセットが各研究チームに提供され、これをもとにした研究が発表される予定である※1。
※1 WWW2006 3rd Annual Workshop on the Weblogging Ecosystem: Aggregation, Analysis and Dynamics
また、研究者自らがコミュニティ支援システムを構築し、サービスとして運用している例もある。西村らによる人工知能学会全国大会支援システムでは、論文著者および学会参加者に限定したSNSを提供し、社会ネットワークに関するデータを収集している[2](図1)。
3.2. ネットワークの抽出
ブログ・SNSのデータは有用であるが、これらはWeb上に情報を発信している個人のみが対象となるため、実社会の社会構造を反映しているとはいえない。より詳細な社会ネットワークを得るためには、情報源をWeb全体に拡張し、ここからネットワーク情報を抽出する必要がある。こういった手法としては、Kautzらによる「Refferel Web」[3]が知られているが、その後の研究によって様々な用途への応用が進んでいる。Adamicらは、メーリングリストやWebページのリンク関係から個人間のネットワークを抽出する手法を提案している[4]。Mikaによる「Flink」[5]や松尾らによる「Polyphonet」[6]では、あらかじめ人名のセットを用意し、検索エンジンを用いて任意の2名の人名が共起するWebページの数から関係の強さを判定し、ネットワークを構築する。また、松尾らは、得られたWebページの内容を分析し、関係の種類(共著関係・同じ研究室に所属している関係など)を判別している。
3.3. ネットワークの分析
SNSや前述のネットワーク抽出手法によって得られる大規模社会ネットワークの分析研究は数多い。Adamicらは大学内SNSを対象として、ネットワークおよび参加者の特性を分析している[7]。安田は、人工知能学会関係者のネットワーク分析から、各人のネットワーク指標(中心性など)とパフォーマンスとの相関関係を調査している[8]。
2005年9月には、国内最大規模のSNSであるmixiのデータを利用した分析研究のワークショップが行われ、マルチエージェント研究、社会ネットワーク分析、大規模ネットワーク分析の観点からmixiネットワークの特性が検討された※2。また、2006年3月にはブログによって形成されるネットワークの分析研究を対象としたワークショップが行われた※3。
※2 Webが生み出す関係構造と社会ネットワーク分析ワークショップ
※3 AAAI Spring 2006 Symposia on Computational Approaches to Analysing Weblogs
社会ネットワークにおける個人の振る舞いを分析する研究として、松村らは、電子掲示板上で行われる議論から、参加者の応答関係を抽出・分析することで有力な発言者を特定する手法を提案している[9]。
3.4. ネットワークの応用
工学的見地から、ネットワーク分析の結果を新たな支援に生かす方法論についての事例が増加している。
基本的に、Webはすべてのユーザに対する情報公開を行うための手段であるが、情報の内容によっては特定のユーザにだけ公開するというアクセスコントロールが必要である。アクセスコントロールにはさまざまな手法が考えられるが、社会ネットワークの概念を導入することで、一定の関係性を満たすユーザの間で情報共有を行うゆるやかなモデルが提案されている。
大向らは、システム上のコミュニケーション履歴からコミュニティを推定し、コミュニティ単位での情報のアクセスコントロールを自動的に行う手法を提案している[10]。また、森らはコンテンツ管理システムと社会ネットワーク分析を統合し、コンテンツの書き手が明示的かつ容易に情報公開の範囲を指定するシステム「Roligan」の開発を行っている[11]。土方らは、ネットオークションにおける取引履歴から社会関係を構築し、相互評価のテキスト情報から有益な情報を取り出すSocial Summarization法を提案している[12]。
ブログの社会性を明確に意識し、拡張する研究としては、大向らがブログが生成するRSSメタデータとFOAF(後述)を組み合わせ、個人中心の情報流通基盤の構築を目指すSemblogプロジェクトを行っている[13]。
4. 実世界とWeb
情報技術による実世界の活動支援としては、モバイルコンピューティングやユビキタス・パーベイシブコンピューティング等の研究分野が存在する。これらは、個人が所持するデバイスや環境に設置されたセンサーがネットワークで接続された状況におけるサービス基盤として注目されれている。近年では、これらに加えて、Web上の情報が統合された新たなサービスが登場している。
例えば、地図情報や周辺の店舗情報等の巨大なデータベースが、Webを介して携帯電話等の小型デバイスによって検索可能になっているが、デバイスにGPSや地磁気センサーが実装されている場合には、これらの情報を入力として自動的に検索を行うことができる。この場合、ユーザは検索に際して意識的に操作をする必要がなく、コンテクストに応じた情報が状況に応じて配信されているように見える。
こういった実世界とWebの融合事例は、デバイスやセンサーの機能が進歩するにしたがって増加を続けている。また、高度な支援を実現するために、取得された情報を集約して粒度の大きい情報を抽出する研究が進められている。さらには、先に述べた社会ネットワークに関する情報をも組み合わせることで、実世界におけるコミュニケーション支援が可能になりつつある。
4.1. 位置情報の利用
実世界情報の取得手段として最も普及が進んでいるのは、携帯電話に実装されたGPS機能である。上松らは、GPS機能を持つ携帯電話を利用して、ブログ記事や写真に位置情報を付加することで、地図上にこれらの情報をマッピングする場logを提案した[14]。場logでは、位置情報を通知することで現在の位置に最も近いコンテンツを得るなどの検索手法も提供している。位置情報を利用したブログの集約サービスは、「GeoURL」や「はてなマップ」などで実運用がなされている。
現状では全ての記事に位置情報が付加されていることは期待できないが、間瀬らの研究では、ブログ記事内に複数存在する地名を地図にマッピングし、それらの距離関係から記事が主題としている地域を推定する手法を提案している[15]。
前述の人工知能学会全国大会支援システムでは、赤外線を利用した音声デバイスCoBITや非接触型ICカードFelicaを利用し、各参加者が会場のどの位置に滞在しているかをWeb経由で検索するシステムが提供された。
Webにおける位置情報の利用については、2005年4月に専門の会議が開催されている※4。
4.2. 行動情報の利用
デバイスやセンサーによって得られたコンテクスト情報は、ユーザ単位で時系列に集約することで、より抽象度の高い行動情報として利用することが可能である。
沼らは、前述の場logならびに学会支援システムから各ユーザの行動履歴を取得し、これをもとにブログ記事の下書きを自動生成する「ActionLog」を提案している[16]。
ホンダでは、車載システムによって収集された走行情報および所要時間から道路の渋滞状況を推定する「インターナビ・フローティングカーシステム」が提供されている。このシステムによって得られた交通情報はWebを通じて共有され、位置情報ビューアであるGoogle Earthで閲覧することが可能である(図2)。
位置情報の他にも、個人のスケジュール情報を共有し、複数人での共同作業を支援する「30 Boxes」など、時間管理のためのツールが注目を集めている。また、Webにおける時間情報の利用について、2005年12月にワークショップが開催された※5。
こういった流れをさらに進めて、人間の活動のあらゆる局面を記録し、検索可能にするプロジェクトの代表例として、DARPAによる「LifeLog」やMicrosoftによる「MyLifeBits」がある[17]。
4.3. 社会関係の利用
実世界におけるイベントを取得する際に、その時間および場所に誰がおり、その人物とどのような関係にあるかといった情報は極めて重要である。しかしながら、このような情報をイベントごとにユーザに記述させるコストは非常に大きい。この問題に対し、Davisらは、携帯電話での写真撮影の際に、携帯電話に内蔵されたBluetooth通信を利用して周りの知人の情報を収集、記録することで、画像に対して周囲の人物のリストを自動的にアノテーションすることを可能にした[18]。この情報と、前述の社会ネットワーク情報を組み合わせることによって、画像のコンテクストが明示化される。また、位置情報や時間情報を加えることで、イベントの種類を特定することも可能になる。
5. データ・アプリケーションの統合
これまでに述べてきたように、実社会ないし実世界とWebを接続する試みは緒に就いたばかりである。今後は、個別の研究あるいはサービスを統合し、より高次の活動支援に向けた研究開発が進められることが期待される。ここでは、データレベルおよびアプリケーションレベルの統合に必要な技術を紹介する。
5.1. メタデータとオントロジー
実社会および実世界に渡る多種多様な情報を統一的に扱うためには、何らかの規約が必要となる。Web上でこういった情報統合を目指すにあたっては、セマンティックWebの諸技術が有効であると思われる。セマンティックWebでは、あらゆる情報をRDFで記述することで、コンピュータによる推論を可能にする[19]。また、それぞれの情報の意味を、同じくRDFをベースにして記述された辞書であるオントロジーによって定義することで、複数の情報源間で起こりうる意味の揺れを吸収する。
すでに、ブログ等ではWebコンテンツの構造を定義するメタデータフォーマットRSS[20]を利用した情報配信が一般化しており、数億を超えるRSSコンテンツがRSS専門の検索エンジン等を通じて入手することができる。また、社会ネットワークを記述するためにRDFで定義されたFOAF[21]も、一部のブログサービスにおいてサイト間のリンク関係を示すために利用されている。
近年では、RDF以外にもXHTMLのコンテンツに直接メタデータを埋め込むためのMicroformatsが提案されており、その一環として友人の情報を記述するためのXFNや、カレンダー情報を記述するhCalendarなどが徐々に普及しつつある。
デバイスに依存する部分では、デジタルカメラあるいは携帯電話で撮影した画像ファイルに埋め込むためのメタデータ規格であるEXIFが広く利用されており、位置情報などはこれを用いて記述される。こういった情報を実際に利用する場合には、画像ファイルからEXIFデータを抽出し、適宜RDFやMicroformatsに変換する必要がある。
オントロジーとしては、辞書として利用可能なWordNetや、地理情報を階層構造で定義したTGN、ディレクトリ型検索エンジンの階層構造をオントロジーとして利用可能にしたOpen Directory RDF Dumpなどが入手できる。また、オントロジー検索エンジンSwoogleによって、用途に応じた様々なオントロジーを探すことができる。
5.2. デバイスとWebサービス
実社会・実世界をWebと接続するためには、ユーザの情報を取得するためのデバイスと、Web側で情報を受け取り、処理を行うWebサービスが整備されている必要がある。
デバイスについては、前述のように、携帯電話に実装されたカメラ、GPS、Bluetoothといった諸機能や、RFID、非接触型ICカードなどを利用することが可能である。Webサービスの代表例としては、地図情報に任意のコンテンツを貼りつけるためのGoogle Maps APIや、ブログの記事管理を行うためのAtom Publishing Protocol等がある。
デバイスとWebサービスが緊密に連携を行っている例としては、NokiaならびにYahoo!による写真共有サービスがある。携帯電話によって撮影された画像を、写真共有のためのWebサービスであるFlickrに直接アップロードすることが可能である。ネットワーク接続が可能な状況においては、撮影と共有が同時に行われることで、実世界における写真を通じたコミュニケーションが活性化されることが期待される。
6. リアルワールドとしてのWeb
3章および4章において、現在進行中の研究を紹介してきたが、これらがWebの一般ユーザに受け入れられるようになるためには多くの課題が存在する。本章では、これらの課題について述べたあと、リアルワールドとしてのWebがどのような姿になるかについて議論する。
6.1. 課題
第1の課題は、社会ネットワークを明示的に扱うことによって起こりうる懸念の解消である。社会ネットワーク分析による知見の獲得や利便性の提供と、近年とくに重要視されている個人情報の保護とを両立させることは難しいが、分析対象となるユーザに対して、ある手法を適用することによるメリットとリスクを明確に示し、納得してもらうプロセスが必要不可欠であると思われる。対象問題によっては、匿名ユーザの存在を認めるなどの措置が必要となる場合もある。これによって、得られるデータの精度は低下するが、このようなトレードオフをどの程度許容するかなど、研究開発を行うにあたっては事前の綿密な設計が必要である。
次に、社会ネットワーク上で流通する情報の信頼性評価が未解決の難問として挙げられる。セマンティックWebの分野においても、情報の信頼性を保証することが最上位の問題として提示されている。情報の信頼性には、誤字脱字や文法ミスといった低レベルの問題から、論理矛盾、情報の改竄やなりすまし等に至る高次の問題までが含まれており、それぞれに解決法が異なる。アプリケーションの精緻化や認証システムの導入によって大部分の問題は処理可能であるが、最終的には社会ネットワーク上の他者を信頼するかどうかという、コンピュータでは扱えない問題が残る。ただし、山岸はそのような信頼は定義上投機的なものであると指摘しており[22]、現状ではユーザの意思決定問題として扱う必要があると思われる。
他にも、現実世界に存在する社会ネットワークと、抽出可能な社会ネットワークとの間に存在する質的な差異について詳細な検討が必要であるとの指摘がある。SNSにおいて、友人関係を構築するには1クリックしかかからないのに対して、現実世界ではそのような関係を構築し、維持するために多大なるコストを要するため、経済的合理性を考慮する必要がある。この違いが、構築されるネットワークの特性にどのような影響を与えるかを知るためには、大規模な調査が必要になると思われる。
よりプラクティカルな問題としては、Webから情報を抽出する際に個人名を特定するための名寄せ処理がある。同姓同名の分離や、時系列で所属が変化する場合の対応など、自然言語処理やネットワーク分析の諸手法を組み合わせた問題解決手法が求められている。
実世界情報の扱いについては、デバイスから得られる情報に含まれる誤差やノイズの処理が大きな課題である。これらを解決し、より粒度ならびに抽象度を高めた情報を流通させることで、コンテクストの変化に左右されない他サービスとの円滑な連携が可能になる。
6.2. 展望
リアルワールドとしてのWebにおいて、ページ単位の検索ではなく、知識の主体である個人単位の検索を実現することは目標の1つである。富士通研究所によるKnowWhoシステムでは、グループウェアを拡張し、各人が作成した文書の類似性やスケジュールに登録されたイベントの共通性から社内の人間関係ネットワークを構築し、あるトピックの専門家がどの部署に在籍しているかを検索することが可能である[23]。KnowWhoシステムは組織内の活動支援を目的として構築されたものであるが、これまでに述べてきた研究開発成果を統合することで、同様の機能をWeb上で実現することは可能であると思われる。
しかしながら、サービスを構築することができたとしても、ユーザがこれを積極的に利用するかどうかは別の問題である。一般に、コミュニティを対象とするサービスは多数の利用者が存在してはじめてその機能を発揮するように設計されているが、一定のユーザ数に達するまでのインセンティブが欠如している場合に、その試みは失敗に終わることが多い。そのため、初期ユーザに対するインセンティブと、その後のインセンティブを別個に設計し、段階的に移行させる戦略が必要となる。このようなサービスデザインについては方法論が確立していないため、今後事例を積み重ねて検証を行っていく必要がある。
インセンティブの問題が適切に解決された例として、フォークソノミーを挙げることができる[24]。フォークソノミーは、コミュニティのメンバーが複数人で構築する語彙の体系を意味する。このようなボトムアップ型の手法では、ユーザの絶対数あるいはユーザ間のコミュニケーションの不足によって完成に至らない例が多く見られるが、フォークソノミーでは、個人のブックマーク管理作業と語彙の整備作業を同一化し、その結果を自動的に共有させることで初期段階のデータの不足状態を解消した。その後は、語彙を整備することによって他者から得られるコンテンツの質が高まるというインセンティブプロセスが機能し、さらに多くのユーザを巻き込むことが可能になった。
フォークソノミーによって形成された、コミュニティと語彙体系のネットワークに対して、社会ネットワーク分析と同様の手法を適用し、より精度の高い体系に変換する研究も登場しており[25]、Webから集合知を引き出す手法が注目されている。今後は、3章における分類と同様に、分析による集合知の抽出だけではなく、参加者が意識的に集合知を構築するための手法、得られた知識の再分析や応用に焦点が移るものと思われる。ここでも、参加者のインセンティブを考慮したシステム設計が必要になることは間違いない。
7. まとめ
これまでに見てきたように、サイバースペースとリアルワールドは急速に接近し、融合を始めている。Webを通じた実社会・実世界の情報抽出が可能になり、より高次の知識にまとめられることによって、Web上の人々に対する活動支援は洗練され、その結果として抽出可能な知識も増加する正のフィードバックが形成されつつある。今後はユビキタス技術との統合が進み、Webを取り巻く環境はさらに進歩すると思われる。しかしながら、実社会・実世界から得られる情報の種類が増加するに従って、統一的に処理を行うことが難しくなるため、データ統合ならびにアプリケーション統合の基盤の重要性が高まる。また、日常生活が常時情報技術に晒される状況での情報のコントロールは難しくなる一方である。機械に対する情報のコントロール=セキュリティと、人間に対する情報のコントロール=トラストに関するさらなる研究が必要になると思われる。
これらの課題は、今後のWebの設計においても現実社会のシステム設計においても全く同様である。その意味でも、Webのリアルワールド化は進行しているといえる。
参考文献
[1] Rheingold, H.: The Virtual Community: Homesteading on the Electronic Frontier, MIT Press (2000).
[2] 西村拓一, 濱崎雅弘, 松尾豊, 大向一輝, 友部博教, 武田英明: 2003年度人工知能学会全国大会支援統合システム, 人工知能学会誌, Vol.10, No.1, pp.43-51 (2004).
[3] Kautz, H., Selman, B., and Shah, M.: Referral Web: Combining Social Networks and Collaborative Filtering, Communications of the ACM, Vol.40, No.3, pp.63-65 (1997).
[4] Adamic, L. and Adar, E.: Friends and Neighbors on the Web, Social Networks, Vol.25, No.3, pp.211-230 (2003).
[5] Mika, P.: Flink: Semantic Web Technology for the Extraction and Analysis of Social Networks, Journal of Web Semantics, Vol.3, No.2 (2005).
[6] Matsuo, Y., Mori, J., Hamasaki, M., Ishida, K., Nishimura, T., Takeda, H., Hasida, K., and Ishizuka, M.: POLYPHONET: An Advanced Social Network Extraction System, Proceedings of 15th International World Wide Web Conference (WWW2006) (2006).
[7] Adamic, L., Buyukkokten, O., and Adar, E.: A Social Network Caught in the Web, Technical report, Hewlett-Packard Labs (2003).
[8] 安田雪: 人脈づくりの科学, 日本経済新聞社 (2004).
[9] 松村真宏, 大澤幸生, 石塚満: 影響の普及モデルに基づくオンラインコミュニティ参加者のプロファイリング, 人工知能学会論文誌, Vol.18, No.4, pp.165-172 (2003).
[10] 大向一輝, 武田英明: 人間関係ネットワークに基づく情報フィルタリングを用いた協調的タスクスケジューラ, 電子情報通信学会論文誌, Vol.J87-D1, No.11, pp.1020-1029 (2004).
[11] Mori, J., Sugiyama, T., and Matsuo, Y.: {Real-world Oriented Information Sharing using Social Networks, Proceedings of the 2005 International ACM SIGGROUP Conference on Supporting Group Work (2005).
[12] Hijikata, Y., Ohno, H., Kusumura, Y., and Nishida, S.: Social Summarization of Text Feedback for Online Auctions and Interactive Presentation of the Summary, Proceedings of 11th ACM International Conference on Intelligent User Interfaces (2006).
[13] Ohmukai, I., Takeda, H., Numa, K., Hamasaki, M., and Adachi, S.: Metadata-driven Personal Knowledge Publishing, Proceedings of the Third International Semantic Web Conference (ISWC2004) (2004).
[14] Uematsu, H., Tokunaga, T., Numa, K., Ohmukai, I., and Takeda, H.: Balog: Location-based Information Aggregation System, Poster Proceedings of the Third International Semantic Web Conference (ISWC2004) (2004).
[15] 間瀬哲也, 大向一輝, 武田英明, 中山泰一: 行動支援のための地域情報の収集・提示システム, 電子情報通信学会技術報告 (2006).
[16] Numa, K., Hirata, T., Ohmukai, I., Ichise, R., and Takeda, H.: Action-oriented Weblog to Support Academic Conference Participants, Proceedings of IADIS International Conference Web Based Communities 2006 (WBC2006) (2006).
[17] Gemmell, J., Bell, G., and Lueder, R.: MyLifeBits: A Personal Database for Everything, Communications of the ACM, Vol.49, No.1, pp.88-95 (2006).
[18] Davis, M., House, N., Towle, J., King, S., Ahern, S., Burgener, C., Perkel, D., Finn, M., Viswanathan, V., and Rothenberg, M.: MMM2: Mobile Media Metadata for Media Sharing, Extended Abstracts of the Conference on Human Factors in Computing Systems (CHI2005), pp.1335-1338 (2005).
[19] Berners-Lee, T., Hendler, J., and Lassila, O.: The Semantic Web, Scientific American (2000).
[20] Hammersley, B.: Content Syndication with RSS, O'Reilly & Associates (2003).
[21] Brickley, D. and Miller, L.: FOAF Vocabulary Specification, http://xmlns.com/foaf/0.1/ (2004).
[22] 山岸俊男: 信頼の構造 -こころと社会の進化ゲーム, 東京大学出版会 (1998).
[23] Igata, N., Tsuda, H., Katayama, Y., and Kozakura, F.: Semantic Groupware and Its Application to KnowWho using RDF, Poster Proceedings of the Second International Semantic Web Conference (ISWC2003), pp.1335-1338 (2005).
[24] Mathes, A.: Folksonomies - Cooperative Classification and Communication Through Shared Metadata, Technical report, University of Illinois Urbana-Champaign (2004).
[25] Mika, P.: Ontologies are us: A Unified Model of Social Networks and Semantics, Proceedings of the Fourth International Semantic Web Conference (ISWC2005) (2005).
----
本論文は非公式バージョンです。学術論文へ引用される場合には、必ず「人工知能学会誌」2006年7月号掲載の論文をご参照ください。(大向一輝, 武田英明, 松尾豊: リアルワールドとしてのWeb, 人工知能学会誌, Vol.21, No.4, pp.403-409, 2006.)
本論文は非公式バージョンです。学術論文へ引用される場合には、必ず「情報処理」2006年9月号掲載の論文をご参照ください。(大向一輝: SNSの現在と展望 -コミュニケーションツールから情報流通の基盤へ-, 情報処理, Vol.47, No.9, pp.993-1000, 2006.)
----
SNSの現在と展望 -コミュニケーションツールから情報流通の基盤へ-
Current Status and Future Perspectives of Social Networking Services
大向 一輝
Ikki Ohmukai
国立情報学研究所 / 総合研究大学院大学
National Institute of Informatics / The Graduate University for Advanced Studies
1. はじめに
近年、家庭向けブロードバンドやインターネット接続可能な携帯電話の普及によって、Webのユーザ数が飛躍的に増加している。これにともなって、Webは情報収集のためだけではなく、個人間のコミュニケーションの場として利用されるようになってきた。
Web上でのコミュニケーション手段として、すでに普及が進んでいる電子掲示板システム(BBS)やブログ(Weblog)[1]に次いで、利用者が急増しているのがソーシャルネットワーキングサービス(SNS)である。SNSは、会員制のコミュニティサイトの一種である。SNSでは、参加者がそれぞれに固有のページを持ち、他の参加者と相互にリンクすることで小規模のコミュニティを形成する。コミュニケーションはその内部でのみ行われるため、不特定多数に情報が公開されるBBSやブログとは異なる密接なコミュニケーションが可能になる。
SNSは海外で誕生したサービスであるが、国内でも普及が進み、国内最大のSNSは600万人以上の会員を得ている。また、既存の情報サービスとSNSが融合した例も数多い。
SNSは、旧来のWebサイトやBBSと異なり、参加者の同一性を特定しやすいため、コミュニケーション分析の研究対象として注目を集めている。また、SNS上では大規模な社会ネットワークが形成されるため、ネットワーク分析手法を適用することで新たな知見が得られる可能性がある。
本稿では、SNSの発祥から現在に至るまでの変遷について述べた上で、研究対象としてのSNSの位置づけについて議論し、今後の課題や展望について述べる。
2. SNSとは
2.1. Webコミュニケーションの変化
ネットワークを利用したコミュニケーション手段としては、古くから会員制パソコン通信におけるBBS・フォーラムや、インターネットにおけるUsenet・ニュースグループといったシステムがある。これらのシステムでは、カテゴリ分けされたテーマごとに議論の場が設けられ、参加者は各自の興味に沿ってそれぞれの場にメッセージを投稿する。特定のトピックに関する一連のメッセージの集合はスレッドと呼ばれ、コミュニケーションの履歴はこのスレッドごとに管理される。
Webにおけるトピック指向のコミュニケーションシステムとしては、パソコン通信と同様のBBSや、コミュニティサイトと呼ばれる会員制のものがある。また、メーリングリストは電子メールを利用したスレッド指向コミュニケーションであるといえる。
トピック指向コミュニケーションシステムは、トピックに対してメッセージを投稿するだけでそのコミュニティに参加できるため、参加に対する敷居が低い。また、議論の内容が重要であるため、投稿者の記名性が問題にされないことも多い。この特徴を積極的に活用した大規模コミュニティが、匿名BBSの集合体ともいえる「2ちゃんねる」である。また、米国ではオンライン上のクラシファイド(個人向け3行広告)サービスである「craigslist」による情報交換が盛んである。
その反面、トピック指向コミュニケーションにおいては、投稿者の存在が見えにくい。あるスレッドにおける特定の投稿者が、他にどのようなトピックに興味を持ち、投稿しているかを知ることは極めて難しい。
SNSは、日常的なコミュニケーションの支援を目的として、コミュニケーション主体である個人の存在を明示化し、個人間の情報流通を実現するためのシステムであると定義できる。本稿では、このようなコミュニケーションの形態を個人指向コミュニケーションと呼ぶこととする。
代表的なSNSである「mixi」のスナップショットを図1に示す。SNSの各参加者は、サービス上で自分のページが与えられ、プロフィールや日記など、自身に関する情報を掲載する。他の参加者の情報を閲覧するためには、その参加者と知人関係を構築する必要がある。多くのSNSでは、相互承認を行うことで知人関係が成立する。自身の情報は、原則として知人のみに公開されるが、間接的な知人への公開や、SNSの参加者全員に公開するなどの制御が可能である。関係を構築した知人の情報は制御の結果に応じてすべて自分のページに集約されるため、周囲の情報を容易に得ることができる。
知人関係に基づく情報の発信・受信に加えて、トピック指向のコミュニケーション機能を備えるSNSもある。ここでは、トピックはコミュニティと呼ばれ、コミュニティごとにBBSが設置されている。各コミュニティには、参加者のリストが表示され、各自のページとリンクされるため、一般のBBSのような匿名性はない。
SNSの形態に近いコミュニティサイトとしては、企業・大学といった所属組織ごとのコミュニティサイトがある。このようなサイトでは、組織内のコミュニケーションの活性化が目的であるため、話題・トピックを限定せず、各参加者の存在を可視化する機能を持つものが多い。その点で、SNSは組織内コミュニティサイトをWeb全体に拡張したものであると考えることもできる。
2.2. SNSの歴史
個人指向のコミュニティサイトがSNSと呼ばれるようになったのは、2003年に米国で開設された「Friendster」が最初であるとされている。Friendsterは急速にユーザを獲得し、開設後3ヶ月で100万人に達したことから注目されるようになった。その後、Googleによる「Orkut」が人気を集め、2004年の初頭には日本のユーザにも知られるようになった。同時期に、米国ではSNSを利用してジョブマッチングを行う「LinkedIn」など、多様なサービスが展開されるようになった。
日本では、2004年2月に「GREE」および「mixi」が開設され、米国と同様に普及している。国内最大手のmixiは、2006年12月現在で670万ユーザを獲得している。
SNSの普及は全世界的に進行しており、世界最大のSNSである「MySpace」の会員数は1億1,000万人を超え、1日あたり25万人の新規登録がある。他にも、大学生向けSNSの「Facebook」やMicrosoftが運営する「Wallop」など、ユーザ数が1,000万を超すSNSがいくつか存在する。これらは英語でのサービスであるため、参加者の国籍・居住地は多種多様であるが、韓国のSNS「CyWorld」は韓国語圏でのサービスながら1,300万ユーザを抱えており、韓国の総人口の30%程度、20代の女性の95%が参加しているといわれている。
利用者数の統計としては、米Nielsen//NetRatingsによる2006年4月の全世界の利用者数が6億8800万人、総務省による日本国内の利用者数が716万人という数字がある。
このように、SNSは急速に普及しており、認知度が高まるにつれて類似サービスが続々と登場している。SNSの最新事例の詳細は、「ソーシャルネットワーキング.jp」に掲載されている。現在では、既存のサービスとSNSの機能を統合したサービスが多く、どのサービスがSNSであるのかを明確に区別することが難しくなっている。当初はSNSの定義として、すでに参加しているユーザからの招待が必要(招待制)、というものがあったが、現在では多くのサービスが登録制になっている。
例えば、ブログとの統合では、友人関係を定義した上で、ブログ記事のそれぞれについて公開・非公開をコントロールすることが可能な「LiveJournal」が広く普及している。また、ブックマーク共有の「del.icio.us」、画像共有の「Flickr」、動画共有の「YouTube」などのサービスにおいても、SNSとしての機能を一部備えている。
また、話題・トピック限定のSNSや、地域限定のSNSなど、ユーザの範囲を限定したSNSも数多い。後者の例として、熊本県八代市による「ごろっとやっちろ」を筆頭に、行政主導のサービス展開が模索されている。
コミュニケーション手段としてのSNS以外に、他の用途にユーザ間の社会関係を導入する動きもある。「Rojo」では、RSSリーダーとSNSを統合することで、大量の記事の中から知人が興味を持っているものを優先的に表示させるなど、検索・推薦の手段としてSNSを利用している。
3. SNS研究の現状
SNSでは、個々の参加者のふるまいだけでなく、参加者間のつながりの総体としての大規模ネットワークを観察することができる。この特徴を利用して、工学やコンピュータ科学のみならず、社会学や心理学、物理学のアプローチを用いた研究が進められている。
本章では、これらの研究をコミュニケーション分析、社会ネットワーク分析、および情報・知識共有の3つの観点に基づいて分類し、紹介する。また、研究者に特化したSNSの構築・運用例について取り上げる。
3.1. コミュニケーション分析
SNSに関する代表的な研究のひとつとして、社会学ならびに心理学の観点からSNSにおけるコミュニケーションの特性を明らかにするものがある。川浦らは、mixiの参加者に対してアンケートを行い、SNS利用の目的(日記・コミュニティ)、実名・顔写真の公開の有無とコミュニケーション指向との関連を調査している[2]。これによれば、日記すなわち知人とのコミュニケーションを主に利用するとの回答が80%にのぼり、mixiが記名制のBBSとは異なった利用のされ方をしていることがわかる。また、実名・顔写真の公開の有無については、それぞれを公開している参加者ほど新たな他者とのコミュニケーションを求め、非公開であるほど現実の知人関係でのコミュニケーションを求めている傾向が明確になっている。また、同じアンケート調査から性別・年代別の利用者意識を抽出する研究もある。ただし、これらの研究は2005年3月時点(会員数約40万人)のアンケートに基づいており、その後の参加者層と傾向が異なっている可能性があるため、継続的な調査が必要であると思われる。
海外の研究事例では、英語で提供されているSNSにおいて、参加者の国籍あるいは国民性とふるまいの特性との関連を調査した研究がある。この研究では、参加者同士が知人関係を成立させるにあたり、事前にどの程度のコミュニケーションがあったかを参加者の国籍ごとに分類して議論している。SNSの使われ方には背景となる文化による違いが存在すると思われるため、こういった比較研究は増えていくものと予想される。
3.2. 社会ネットワーク分析
社会ネットワーク分析は、社会学の中でも、人と人を結ぶ関係に着目し、関係構造であるネットワークを分析することでコミュニティ全体の特性を明らかにする学問分野である。社会ネットワーク分析を行うためには、計量可能な形でネットワークを記述する必要があるが、個人間の関係は非明示的であることから、従来の研究ではアンケート調査等によってネットワークを把握していた。この方法ではコストの問題から大規模なネットワークを扱うことが難しかったが、インターネット上では容易に社会ネットワークを得ることができるため、急速に研究が発展している。社会ネットワークの例として、mixiの参加者によるネットワークの一部を図2に示す※。
※社会ネットワークの可視化には「mixiGraph」を利用した。
SNSが出現する以前にも、メールやコミュニティサイトを対象とした社会ネットワーク分析研究は多数存在しており、この時点で方法論はある程度確立されている。これについてはWellmanの論文[3]にて詳しく議論されている。
基本的には、各ノード(参加者)について中心性と呼ばれる指標群を計算し、その結果を用いてノードの評価やクラスタリング等の処理を行う。中心性には、ノードの持つリンクの数(次数)、任意のノードとの平均距離(近接性)、任意の2ノード間の最短経路に含まれる割合(媒介性)、固有ベクトルの値等がある。他にも、ネットワークの密度を計測する指標として、あるノードと接続されたノード同士がどの程度接続されているかを見るクラスタリング係数等がある。なお、ネットワークの分析に際してどの中心性・指標を重視するかは、分析の対象および内容によって異なる。
こういった指標を利用した分析の例として、安田らは数年間に渡って人工知能学会関係者のネットワーク(取得方法は後述)を分析し、ある年度における各研究者の媒介性が、次年度の共著論文の数と相関するといった知見を示している[4]。この知見は因果関係としては採用できないが、研究コミュニティにおける研究トピックの推移を俯瞰するための手段として有用であると思われる。
SNSの分析としては、このように具体的な内容に踏み込んだ研究はまだ見られないが、いくつかの構造分析がなされている。森らは、2005年2月時点のmixiの全参加者36万人に対して中心性を用いたクラスタ分析を行い、参加者を3つのグループに分類した。また、松尾らは同じデータについて知人数の上位200名のみで構成されたネットワークを分析し、どのノードも孤立することなしに1つのネットワークに集約されることを示した。これらの結果より、多数のリンクを持つノードのグループ同士が密接につながっていることが確認された※。
※森ら、松尾らの研究は、株式会社ミクシィより個人情報を特定できない形で提供されたデータに基づく。各研究グループの成果は社会情報学フェア2005にて発表された。
この現象は、大規模な複雑ネットワークにおいて普遍的に観察されるスケールフリー性およびスモールワールド性を示している。スケールフリー性とは、ネットワークを構成するリンクの大部分が少数のノードに接続され、大多数のノードにはごく少数のリンクしか存在しないような状態を指す。このようなネットワークについて、図3のようにノードとリンクの関係をプロットすると、規模に関わらず同様のべき乗分布を示すため、スケールフリーと呼ばれている。一方、スモールワールド性とは、ネットワークの規模に比して任意の2ノード間の距離が短くなるような性質のことであり、これを満たすためにはランダムネットワーク(ノード間の関係に法則性がないネットワーク)と比較してクラスタリング係数が高い必要がある。
これらの知見より、SNSはランダムネットワークではなく、知人同士が密接につながった小規模なコミュニティが、リンク数の多いノード(ハブ)によって大域的に連結された構造であると予想される。
スケールフリー構造を持つ大規模複雑ネットワークがどのように形成されるかについては、Barabasiらが優先選択モデルを提案している[5]。これは、新たなノードが生成された場合に、そのノードがすでに存在するノードに対してリンク数に応じた確率に基づいてリンクを張るというモデルであるが、SNSにおいては、ネットワークは実世界の人間関係の転写という一面があるために、このような優先選択モデルをそのまま採用することはできない。湯田らは、mixiに対する大規模ネットワーク分析を行い、純粋なスケールフリー構造とは一部異なる構造が観察されると指摘している※。このような差異を作り出すネットワーク形成モデルについてはさらなる研究が必要である。
※社会情報学フェア2005より
3.3. 情報・知識共有
SNSに対する情報・知識共有の立場からの興味としては、システム上で流通する情報のアクセスコントロールがある。グループウェア等の情報共有システムは、単一の組織内で運用されるものであるため、システム管理者がアクセス権を制御することができる。しかしながら、SNSにおける知人関係は単一の組織を超えて構築されるのが普通であり、それらをトップダウンに管理することはできない。各参加者は自身で情報管理を行う必要があるが、日常的な情報交換にあたってそのような管理を綿密に行うのは現実的でない。そのため、多くのSNSにおいては、アクセス権限を、直接の知人関係のみ、間接的な知人関係、SNSの参加者全員のように、ホップ数に基づく段階的な設定のみを提供している。しかしながら、この方法では、複数のコミュニティにまたがる情報公開を余儀なくされるため、適切であるとは言えない。
このような問題に対して、Yahoo!のSNSである「Yahoo! Days」などでは、知人関係をコミュニティごとに分類し、情報のアクセス権をコミュニティ単位で付与する機能を提供している。ただし、この方法であっても、コミュニティとして明確に区分できないような範囲に対して情報を発信する場合の作業負荷は大きくならざるを得ない。また、コミュニティを中心としたアクセスコントロールにおいては、コミュニティの参加者が時系列的に変化する場合に、新たな参加者に過去のコンテンツへのアクセス権を付与してよいかといった問題もある。
これについては、コミュニティをあらかじめ定義するのではなく、情報へのアクセス時に現状のネットワーク構造を動的に分析し、その結果を用いて制御を行う手法が模索されている。前節で述べたように、大規模な社会ネットワーク分析手法が整備されつつあり、これらを用いることによって実用的なアクセスコントロールが可能になると期待される。
3.4. 研究者のSNS
SNSに関する研究は、多大なデータを必要とすることから、実サービスの運営者と連携して進められることが多い。その一方で、研究者自らがコミュニティ支援システムを構築し、運用している例もある。人工知能学会大会支援ワーキンググループでは、2003年度より人工知能学会全国大会の論文著者および参加者を対象としたWeb情報支援サービス「Polyphonet Conference」を提供している。Polyphonet ConferenceにはSNS機能が含まれ、研究者のネットワークに関するデータの収集および分析を行っている。図4にスナップショットを示す。
Polyphonet Conferenceでは、一般的なSNSと同様に、参加者ごとのページが用意され、他の参加者と相互にリンクすることでネットワークを拡張していく。しかしながら、論文著者・参加者の全員がシステムを利用するとは限らないため、このようなネットワークによってコミュニティの構造を正確に表現することは難しい。そこで、Matsuoらは、Web全体を情報源としてネットワークを抽出する手法を適用している[6]。この手法では、あらかじめ用意された人名(ここでは論文著者・参加者)のセットから、任意の2名について人名が共起するWebページを検索し、その数から関係の強さの判定およびネットワークの構築を行う。また、得られたWebページの内容を分析することで、関係の種類(共著関係・同じ研究室に所属している関係など)を判別し、ラベル付けを行っている。
Polyphonet Conferenceに格納されたネットワーク情報は、さまざまな方法で検索することが可能である。図5に示すように、自身を出発点として、他の研究者との間にどのような知人関係が存在するかや、ある研究者を取り巻く複数の研究コミュニティを概観することができる。
また、Polyphonet Conferenceでは、各研究者の活動内容をWeb情報を用いて推定することや、知人との関係を明示的に記述するタグ機能、協調フィルタリングによる聴講スケジュールの推薦など、社会関係を利用したアプリケーションを多数提供している。
4. SNSのオープン化とメタデータ
これまでに取り上げてきたSNSは、そのほとんどが中央集権型のアーキテクチャになっている。これは、一定レベルのプライバシーの保護や、意図しない情報公開の抑止に役立っている。その一方で、SNSではブログで見られるようなデータの互換性については全く考慮されていないため、複数のSNSへの参加や活動は非常に面倒である。
先に述べたように、SNSは個人的なコミュニケーションのツールとしてだけではなく、幅広い利用が可能である。用途によっては知人関係を公開することは問題ではない場合もあり、そのような用途に対してオープンなSNSを構築するための基盤が構築されつつある。
代表的な例として、知人関係をメタデータとして記述するためのFOAF(Friend of a friend)がある。FOAFは、RSS 1.0と同じくRDF(Resource Description Framework)の応用例として提案されおり、自身に関する記述および知人との関係に関する記述が可能になっている。一部のブログでは、プロフィールと知人のサイトへのリンクを表現する手段としてFOAFが利用されている。
その他には、XHTMLに埋め込むためのメタデータであるmicroformatsのプロジェクトとして、知人関係を表現するXFN(XHTML Friend Network)がある。XFNでは、ハイパーリンク(Aタグ)のrel属性として"friend"や"met"などの関係を記述する。microformatsを認識する一部の検索エンジンでは、XFNで表現されたコンテンツ間の関係を可視化することができる。
知人関係には多様性があるが、これをメタデータでどのように表現するかは議論の余地がある。FOAFでは"knows"の1種類に限定しているが、XFNでは18種類の属性が定義されている。さらに詳細は関係を表現するためには、知人関係についてのオントロジーが必要になると思われる。
特定のコミュニティサービスのアカウント情報を他のサービスでも利用可能にすることで、汎用化を目指す方向性もある。ブログサービス等を提供している「はてな」では、アカウント情報を図6のようにRDFを用いて記述するフォーマットを提供し、他のブログサービスを利用するユーザに対しても「はてな」が提供する少額決済サービスを利用できるようにしている。
SNSは、その本質からして究極的には各個人が自身の情報を管理し、知人とはP2Pによる通信を行うようなアーキテクチャであることが望ましい。「imeem!」や「Affelio」は、個人がサーバを設置し、サーバ間通信によって情報交換を行うSNSを提供している。
複数のサービスを透過的に利用するという意味では、認証の統一化、シングルサインオン技術が重要である。シングルサインオンは、グリッドなどさまざまな分野で研究が進められているが、Webサービスに特化した活動としては「OpenID」や、ブログのコメントを認証するための「TypeKey」がある。
5. SNSの課題・展望
5.1. 情報の信頼性
SNS上で流通する情報は、その情報源である個人間の関係、あるいはコミュニケーション過程が明示化されることよって信頼性が高いものであるとされている。しかしながら、このような信頼性は、最終的にはシステムを利用する個人の判断に帰着するものであり、何らかの技術が担保するものではない。そのため、SNSはチェーンメールやデマなど、悪意のある情報操作に弱いという一面がある。あるSNSでは、個人情報に関するシステムの脆弱性が発見され、即座に対策がなされたものの、脆弱性に関する情報が参加者の日記を通じて数万人に広まるといった現象が起こっている。典型的な伝播のパターンとしては、知人の日記からこの問題を知り、より詳細な情報を得るために検索を行うと、同じような情報が多数存在するために問題の信憑性が高まり、他の知人へ伝えようとする。大規模なSNSにおいては、このプロセスが数回繰り返されるだけでも広範囲な影響を与えることになる。
また、SNSは容易に情報を発信できるため、自らが過剰な情報公開を行ってしまう例も見られる。とくに、未成年などコンピュータのリテラシーが十分でない層にその傾向が強く、犯罪を誘発しやすい状況になっている。大部分のSNSでは参加者の年齢制限をかけることによりこの問題を回避しようとしているが、実効的に機能しているとはいえない。
これらは情報を扱ううえでの本質的な問題であり、SNSに限定されるものではない。しかしながら、SNSの普及速度に対して問題の周知が遅れているため、さまざまな事象が起こっている。今後は、長期的な視野に立った情報リテラシー普及などが求められる。
技術的観点から情報の信頼性を扱う研究分野としては、セマンティックWebが挙げられる[7]。セマンティックWebは、論理に基づいて記述されたコンテンツや意味体系を整備し、エージェントがそれらを処理することで適切な情報収集を提供する。セマンティックWebにおいても、情報そのものの信頼性を完全に担保することはできないが、電子署名との組み合わせなどによって信頼性の阻害要因を除去するという方向性はSNSにも適用することが可能であると思われる。
5.2. コミュニケーションツールから情報流通の基盤へ
2章でも述べた通り、SNSはコミュニケーションツールの一形態として登場した。個人間の関係の明示化とコミュニケーションは極めて親和性が高く、参加者にとって受け入れやすいものであったため、急速な普及につながったと考えられる。一方、SNSの普及は、基盤となる社会ネットワークの有用性に目を向けさせることにつながった。社会ネットワークとコミュニケーションは分離可能であり、コミュニケーションとは異なる社会ネットワークの利用方法がさまざまな分野で提案されている。広告やマーケティングの分野では、パーソナライゼーションの一環としてSNSの利用が模索されているほか、情報検索や推薦、組織内の人事評価など、対象および利用目的は多岐に渡る。
将来的には、4章で述べたような認証基盤上に各種サービスが構築され、ユーザが自由に必要な機能を選択するオープンなSNSが普及するものと思われる。
情報流通基盤としてのSNSでは、これまで以上に多様なデータが取り扱われることになる。これにともなって、SNSを対象とした研究も高度化すると考えられる。社会ネットワーク分析の分野では、同じ個人が形成する、ドメインに応じた多層のネットワークの分析が注目されている。また、数千万人単位のネットワークを分析するにあたっては、計算量の問題を解決しなければならない。今後は、実サービスを運用する企業と研究者の密な連携によって、SNSの可能性を追究することが望ましい。
参考文献
[1] 武田英明, 大向一輝: Weblogの現在と展望:セマンティックWebおよびソーシャルネットワーキングの基盤として. 情報処理, Vol.45, No.6, pp.586-593, 2004.
[2] 川浦康至, 坂田正樹, 松田光恵: ソーシャルネットワーキング・サービスの利用に関する調査:mixiユーザの意識と行動. コミュニケーション科学, Vol.18, pp.91-110, 2005.
[3] Wellman, B.: Computer Networks As Social Networks. Science, Vol.293, pp.2031-2034, 2001.
[4] 安田雪: 人脈づくりの科学. 日本経済新聞社, 2004.
[5] Barabasi, A.: Linked: The New Science of Networks. Perseus Books Group, 2002.
[6] Matsuo, Y., Mori, J., Hamasaki, M., Ishida, K., Nishimura, T., Takeda, H., Hasida, K. and Ishizuka, M.: POLYPHONET: An Advanced Social Network Extraction System. Proceedings of the Sixteenth International World Wide Web Conference (WWW2006), 2006.
[7] Berners-Lee, T., Hendler, J. and Lassila, O.: The Semantic Web. Scientific American, 2000.
----
本論文は非公式バージョンです。学術論文へ引用される場合には、必ず「情報処理」2006年9月号掲載の論文をご参照ください。(大向一輝:
SNSの現在と展望 -コミュニケーションツールから情報流通の基盤へ-, 情報処理, Vol.47, No.9, pp.993-1000,
2006.)
本論文は非公式バージョンです。学術論文へ引用される場合には、必ず「情報処理」2006年11月号掲載の論文をご参照ください。(大向一輝: Web2.0と集合知, 情報処理, Vol.47, No.11, pp.1214-1221, 2006.)
----
Web2.0と集合知
Collective Intelligence on Web 2.0
大向 一輝
Ikki Ohmukai
国立情報学研究所 / 総合研究大学院大学
National Institute of Informatics / The Graduate University for Advanced Studies
1. はじめに
Web2.0の潮流の中でとくに特徴的なのは、ブログやソーシャルネットワーキングサービス(SNS)で見られるような、参加者自身によるコンテンツの作成・公開である。折からのWebユーザの増加に伴い、こういったコンテンツは質、量ともに向上している。最近では、これらを総称してUGC(User Generated Contents)あるいはCGM(Consumer Generated Media)と呼ばれている。Tim O'Reillyは、Web2.0の基本的性質として「参加のアーキテクチャ」を挙げ、その重要性について議論している[1]。
コンテンツに対する参加者の関わり方は多様である。各個人が独立してコンテンツを作成するだけでなく、コミュニケーション、質問、投票、予測など、Web 上では様々な活動が行われており、その結果が新たなコンテンツとして共有される。そして、それらのコンテンツは参加者による評価を受け、有用なものが広められる。また、直接、間接を問わない参加者間の共同作業によって、ボトムアップ型の知識体系の構築が試みられている。
Web2.0が注目されるなか、このようなコンテンツや知識は「集合知(Collective Intelligence)」と呼ばれ、専門家が持つ知識とは異なった価値を持つものであるとの主張がなされている。
本稿では、Webにおける集合知の現状を概説し、その可能性について述べる。
2. 群衆の叡智
集合知に関する入門書「The Wisdom of Crowds(群衆の叡智)」のタイトルは、1841年に出版された「Extraordinary Popular Delusions and the Madness of Crowds」にちなんでいる[2]。「The Madness of Crowds」では、集団による意思決定は多くの場合において極端に方向に傾くことが指摘されている。この他にも、歴史における「衆愚政治」、社会心理学における「群集心理」、あるいは生物学における「共有地の悲劇」など、集団が引き起こす悪しき問題は各分野で議論されている。
一方で、ハーバート・サイモンが指摘するように、各個人の認識能力が限定的であるために、そこから導かれる意思決定が必ずしも正しいとは言い難い。この問題に対して、複数人の協調によって克服を目指す集合知型のアプローチを取ることは自然である。
「The Wisdom of Crowds」では、集合知が活用されている事例を、「認知」「調整」「協調」の3種類に分類し、紹介している。ここで、「認知」とは所与の問題空間において解候補を列挙し、その中から1つの解を見いだす行為を指す。また、「調整」は、他者が自律的に行動している状況での行動指針の決定問題であり、「協調」とは利害が異なる他者との共同作業によって1つの目的を達成することを意味する。
本書では、集合知が適切に機能している事例に共通する性質として以下の4つを挙げている。
- 多様性
各参加者がそれぞれに独自の視点を持っていれば、総体として多くの候補解を列挙することができる。探索空間が狭い場合には、その探索空間内に適切な解が存在しない可能性がある。
- 独立性
各参加者の持つ意見や提案が他の参加者の影響を受けないよう、各参加者の独立性が確保されている必要がある。とくに小集団で議論を行う場合には、多様性が低いために偏った結論に集約される危険性がある。
- 分散性
問題を抽象化せず、各参加者が直接得られる情報に基づいて判断する必要がある。参加者ごとに得られる情報の種類は異なると予想されるが、多様性を維持するためにも、各参加者に共通する属性のみで判断すべきでない。
- 集約性
上記3点の特性を生かして得られた知識を参加者全体で共有し、比較検討して最終的な結論を導く仕組みが必要である。
このように、集合知の実現には、他の影響を受けない状態でのローカルな知識の生成メカニズムと、それらを集約するメカニズムの両方が必要である。しかしながら、知識を集約するためのコストが非常に大きいため、実際にこれを機能させるためには、組織を設けてその中でルールを定めて活動することになる。その一方で、組織の存在によって参加者の絶対数が制限されるため、そこで得られる集合知のインパクトは小さなものになる可能性がある。
こういった状況に対し、Webではコミュニケーションコストが極めて低いことから、上記の課題を矛盾なく両立させ、多数の参加者を集めるようなシステム設計が可能になる。その結果として、多くの分野でWebを介して集合知を生み出す活動が進められている。
本稿では、Webにおける集合知の利用事例として、Webコンテンツのナビゲーション、協調的な問題解決を取り上げ、考察を行っていく。また、「集合的表現」とも呼ぶべき新たな表現活動の例を紹介する。
3. Webナビゲーションと集合知
現在、Webではユーザによって作成されたコンテンツが急速に増加している。そのきっかけとなったブログは国内で約868万サイト(2006年3月時点、総務省調べ)、海外では数千万サイトが存在し、日々新たなコンテンツが更新されている。また、普及が進んでいるSNSにおいても、国内最大のmixiで 570万ユーザ(2006年9月時点)、海外では1億1000万ユーザを抱えるMySpaceを筆頭に、1000万ユーザ以上のSNSが10程度存在し、その中で膨大な情報が交換されている。
ブログやSNSは、優れたコンテンツマネジメントシステムとしてWebに情報を掲載するためのコストを劇的に低下させたことで、コンピュータの専門家だけでなく他の分野の専門家、そして一般のユーザに対して情報公開の門戸を開いた。その結果、あらゆる種類の情報がWebに掲載されるようになり、それが再びユーザを引きつける要因となっている。
このように情報が増加し続けているWebについて、必要な情報が発見できなくなるのではないかという懸念は常にある。これに対して、さまざまな研究機関や企業がディレクトリサービスや検索エンジンを提供してきた。しかしながら、ディレクトリサービスでは手作業による分類のスピードに限界があり、網羅性が低い。また、検索エンジンではランキング手法の解析によって高評価を受けるように最適化されたページが多数存在し、検索精度が低くなるという問題があった。
その中で、GoogleのPageRankは、集合知を間接的に利用することで上記の問題を解決した[3]。PageRankは、Webページのリンク関係に基づくランキング手法として知られているが、この手法が画期的であったのは、リンクを張る行為をリンク先に対する投票とみなし、投票の結果として形成されるネットワーク構造を分析する点である。ランキングの基準が、Webページ自体の内容から他者による評価に変わったことによって、最適化によるスパム行為を制限することが可能になった。また、Webページが作成された時点ですでに投票を終えていることになるため、全てのWebページを評価対象とすることができる。この2つの利点によって、 Googleは初めて現実的なWebコンテンツのナビゲーションを実現したと言える。
今日、キーワード型の検索エンジンはWebの主役になっているが、その一方で検索エンジンだけでは解決できないような要求が生まれつつある。例えば、ブログにおいては更新直後の情報の発見が重要となるが、新しいものほど被リンクが少ないことや、リンク構造分析の計算コストの問題によって、そういったページの評価が上がりにくい。
また、適切なキーワードが思いつかない場合には検索エンジンはその能力を発揮できない。キーワードの推定や自然文の入力を受けつけるなど、支援技術の研究開発が進められているが、現状ではまだ不十分である。
3.1. 人力検索とソーシャルタギング
前節の要求に対応すべく、集合知を生かしたナビゲーションを実現するシステムが続々と生まれている。これらは、リンク構造分析による評価に見られるようなコンテンツの書き手同士の相互評価だけではなく、読み手による評価を利用するところに特徴がある。
参加者が質問し、別の参加者がそれに答える、いわゆる「人力検索」と呼ばれるサービスはその一例である。質問者は、自然文で知りたい事柄(最近面白かったサイトを教えてほしい、など)提示し、回答者は該当すると思われるサイトのリンクを示しながら回答する。質問者は、それらの回答に対して評価やコメントを与える。これらのやりとりは、すべてサイト上で公開され、後で検索することが可能である。人力検索は、参加者の動向に完全に依存したサービスであるが、質問者と回答者の間で有料のポイントをやりとりさせたり、優れた回答に得点をつけ、総得点のランキングを表示するなど、継続的な利用のためのインセンティブがある。その結果、ブログにおける参加者の増加と同じく、あらゆる分野の質問に答えられるだけの参加者を獲得し、実用的なサービスとして定着しつつある。国内の代表的な人力検索サービスとしては、「OKWave」「人力検索はてな」などがある。
参加に対する敷居の低さから急速にユーザを集めているのがソーシャルブックマークである。ソーシャルブックマークは、Webを通じてブラウザのブックマークを共有することで、他者が興味を持っているトピックや、多くの人が興味を持っているコンテンツの発見を支援するサービスである。ブックマークの共有というアイデア自体は古くから検討されてきたが[4]、実用に足る規模の参加者やコンテンツが集まるようになったのは2004年ごろである。
ソーシャルブックマークのユーザは、ユーザ情報とブックマークすべきURI、コメント等を送信する。多くのサービスでは、ブラウザが表示しているURIを取り出し、サービスに送信するブックマークレットと呼ばれるJavaScriptが用意されている。サービス側では、同一のURIに対するブックマーク数を集計し、ランキング形式で表示している。また、バーストなどの指標を考慮することで、短期的に注目されているコンテンツを表示するサービスもある。ブックマークはユーザごとに一覧することも可能である。これを見ることで、キーワードに頼らない、他人の興味に基づく情報収集が可能になる。
ソーシャルブックマークの派生としては、対象をニュースに限定して内容を評価させるソーシャルニュースや、商品情報に限定したレビューサイトなど、様々な動きが広がりつつある。これまで、ニュースを扱うコミュニティでは、取り上げるべきニュースを編集者が選択し、参加者はそれに対してコメントするものが多かったが、ニュースの選択をも集合知で行うアプローチが成立しているのが興味深い。
集合知を利用したナビゲーションサービスに特有の機能として、ソーシャルタギングと呼ばれる、参加者によるコンテンツの分類がある。参加者は、ブックマークなどに対してタグと呼ばれる任意の文字列を付加し、これを共有する。従来のディレクトリサービスのように、事前に用意されたカテゴリー体系に合わせる必要はない。また、タグは複数個付加することができるようになっている。
コンテンツはタグごとに整理され、閲覧できる。他の参加者が同じタグを使っている場合には、そのコンテンツも一覧に含まれる。タグは、いわばそのコンテンツがどの検索キーワードにヒットするかを自身で決定できるシステムであるとも言える。その特性を利用して、ソーシャルタギングはブックマークだけでなく、画像共有サービスの「Flickr」や映像共有サービス「YouTube」など、キーワード検索の対象になりにくいメディアの検索支援手法として積極的に利用されている。図1は、Flickrでタグ「Rainbow」を指定した際に得られる画像の一覧である。
ソーシャルタギングに対応したシステムにおいて、使用されたタグの一覧を頻度に応じて表示する方法をタグクラウドと呼ぶ。タグクラウドを見ることで、世間でどのようなトピックが興味を持たれているかが直感的に理解できる。代表的なソーシャルブックマークである「del.icio.us」のタグクラウドを図2に示す。
3.2. フォークソノミー
ソーシャルタギングによって得られたタグの集合は、フォークソノミーと呼ばれる。フォークソノミーとは、Folk(人々の,人々による)と Taxsonomy(語彙体系)を組み合わせた造語である。フォークソノミーはボトムアップかつ民主的に作られた語彙であり、その意味で集合知の代表格だと言われている。
その反面、ソーシャルタギングによって作られたフォークソノミーはそれぞれのタグの間に関連性がなく、このままではタクソノミーの代替物として他の目的のために再利用することが極めて難しい。そこで、単語間に関係を導入するために、タギングが行われる際に複数のタグを入力可能であることを利用して、タグの共起関係から統計的に関係を計算する手法が使われる。さらに、タグの分布の包含関係から上位-下位関係を導くなど、より精度の高い体系の自動構築は重要な研究トピックの1つになりつつある。
実際に使われているタグを分析すると、カテゴライズ用途の他に、対象となるテキスト中のキーワードを抜き出したもの、読み手の感想など、その内容は多岐に渡っている。このように、利用目的が異なるものを自動的に分類することは難しい。また、誤字・脱字や表記揺れ、意味的に類似するタグが複数存在することによって、1つのグループにまとめられるべきコンテンツが散逸しやすい。こういった、タグ同士の集約は早急に解決しなければならない問題の1つである。
表記揺れに対する単純な解決策としては、類似した文字列が他の参加者にどのように使われているかを明示化する方法がある。SNSのコミュニティ名はタグと同様に任意の文字列を設定できるため、表記の異なるコミュニティが複数作られる場合がある。表1は、SNS「Gree」において、コミュニティ検索機能を利用して「SFC」を検索した結果と参加人数である。コミュニティの性質上、ラベルは各参加者ともに同じ文字列であることが望ましい。結果として、1つの表記が代表的なものとして多くの参加者を集めている。このような参加者の挙動を利用してフォークソノミーを集約に向かわせる手法は、あらかじめ決められた語彙を使う方法と比較して、参加者自身の意思が反映されるため、納得感が強くなるものと思われる。
タグは文字列であるからこそ参加者にとっての利便性が高く、膨大な量が得られるが、総体としてのフォークソノミーの高度利用については多くの課題がある。しかしながら、多くの参加者が主体的にメタデータを付加するような状況は過去に例を見ない。この状況を活用して、参加者にとってより有用なシステムを構築することが求められる。
慶應義塾大学SFC : 3,209
慶応義塾SFC : 78
慶応義塾大学SFC : 47
慶應大学SFC : 44
慶應義塾大学SFC : 24
慶応義塾大学SFC : 8
慶応大学SFC : 3
4. コミュニティと集合知
一方、参加者間の直接的なやりとりや議論、共同作業によって作り上げる類の集合知も存在する。こういった協調作業を円滑に進めるには、参加者同士の頻繁なコミュニケーションが重要である。コミュニケーションの絶対量はコミュニティの規模に応じて増大するため、コミュニケーションのコストを考慮するとコミュニティの規模には自ずと限界が生じる。集合知を機能させるためにはコミュニティ内に多様性や分散性が必要となるが、これをどのように確保するかが大きな課題になる。また、参加者間に意見の相違や利害関係が発生するために、何らかの意思決定が必要になることもある。多くのコミュニティはボランティアで運営されているため、経済性原理による意思決定は適切でない。本節では、集合知を生み出すにあたって、コミュニティがどのような役割を果たし、またどのように意思決定を行っているかについて議論する。
体系化された知識をWebに集積する試みの中で、最も有名なものが「Wikipedia」である。Wikipediaは、コンテンツの追加と編集が誰でも自由に行うことのできるWikiの特徴を生かし、ボトムアップに百科事典を作ることを目指している。現在は229カ国語のプロジェクトが存在し、最大規模の英語版では約140万語、日本語版では約26万語の見出し語がある(2006年9月現在)。従来の百科事典のように、記事の執筆者が専門家であるとの保証がなされていないため、そのコンテンツの信頼性について疑問視する向きも多い。しかしながら、英国のEncyclopedia Britannicaとの比較研究において、両者の記事の誤り率に有意な差は見いだされず、Wikipediaが専門家によって執筆された事典と同じ役割を果たしうることが示された[5]※。
※記事の信頼性についてはEncyclopedia Britannica側が反論の文書を公開するなど、現在も議論が続いている。
このように、集合知の理想像とも言うべきWikipediaであるが、多数の執筆者が関わることによって起こる問題の解決についても民主的なアプローチが貫かれている。執筆者によって記事の品質にばらつきがある問題については、記事ごとに議論用のページを設け、そこでの結論を踏まえて本文を更新するようなシステムを構築することで、長期的な品質の向上を図っている。また、主張が異なる2名以上の執筆者によって項目の編集とその差し戻しが繰り返される場合には、ガイドラインに沿って当事者同士の直接対話、第3者を交えた議論、投票の順序で民主的な問題解決を目指す。紛争時や一過性の荒らし行為が発生した際に項目の編集機能を一時的に止めるなど、緊急性の高いタスクの処理を担う管理者権限も存在するが、記事の作成に貢献度の高いユーザが立候補し、投票の結果によって権限を与えられる。こういった、コミュニティを支えるための制度は百科事典そのものと同じように日々成長しており、組織論として非常に興味深い※。
※Wikipediaのページでは「Wikipediaは民主主義の実験ではない」と明記されている。
Linuxをはじめとするオープンソースソフトウェア(以下オープンソースと称す)の開発は、インターネット上で最も成功した協調型プロジェクトの1つである[6]。オープンソースのいくつかは、企業で開発されるソフトウェアよりも品質が高く、その開発プロセスにおいても生産性が高いと言われている。その理由は、多くの利用者によって異なる環境での試験がなされ、バグが洗い出されること、また、ソースが公開されていることで多くの修正案が提案されるためである。こういった、問題の発見や解候補の提示は集合知を適用しやすい。
その一方で、実際の開発プロセスでは、ソフトウェア開発という性質上多くのタスクが開発者単位で完結しないため、より密接な共同作業とコミュニケーションが必要になる。また、議論が生じた際には、ソフトウェアのリリースという目的のために必ず意思決定を行わなければならない。そのため、成功しているプロジェクトの多くでは、このような課題をクリアするために、強力な管理機構によってコミュニティのマネジメントを行っている。なお、管理機構の形態はプロジェクトごとに大きく異なっており、Linuxでは初期バージョンの開発者であるLinus Torvaldsが最終的な意思決定権を持つ「やさしい独裁者」モデル、Apacheプロジェクトでは貢献度の高い開発者による委員会方式、Perlコミュニティでは意思決定者が持ち回りで任命されるなど、さまざまな組織形態が存在している。
それでも、プロジェクトのロードマップの策定など、開発者ごとに意見が異なるような議論を収束させることは難しい。そのため、オープンソースは商用ソフトウェアが先行的に存在している分野や、仕様が規格によって定められているようなソフトウェアの開発に向いているとの指摘もある。
4.1. 予測市場
オープンソースとは異なるが、ソフトウェアやサービス開発の方向性について、ユーザの提案を受け入れる動きが広まっている。とくに、コミュニケーションを支援するようなWebサービスでは、ユーザの意見はそのサービスを運営していく上で重要な情報になる。しかしながら、窓口を設けて意見を受け入れるだけでは、有料サービスの無料化など、現実的でない要望が多数を占める恐れがある。そこで、集合知の特性を生かした意見の集約システムが必要となる。
国内最大のSNS「mixi」では、受け付けた要望を会員全体に公開し、個々の要望について会員同士が議論する場を提供している。議論に参加する場合には、良い・悪いのどちらかに投票した上でコメントを投稿する。投票結果は一覧表示されており、有用な提案を発見するための参考情報として利用されている。
ブログやソーシャルブックマークを提供しているはてなでは、予測市場の原理を利用した機能要望システム「はてなアイデア」を運用している。予測市場とは、参加者自身の予測を商品と見立て、この商品の売買を通じて利益の最大化を図る仕組みである。予測市場では、自身の期待や願望だけではなく、他者がどのように振る舞うかを織り込む必要があるため、極端な予測がなされにくいという特徴があり、アメリカ大統領選挙での得票率予測などの問題においてその有効性が検証されている。
はてなアイデアの参加者は、「はてなが次に行う行動は何か」を予測し、これを株式銘柄として登録する。初期段階では、株数が一定数に達するまで定額で販売され、これを超えると市場原理での価格決定に移行する。当該機能が実現された場合にははてなによって市場価格で全株式が買い上げられ、また機能の内容(修正や新機能追加など)によって株数に応じた配当が与えられる。
このシステムでは、実現可能性の低い要望は市場に出回らないため、売却益を得る可能性がない。また、市場で流通したとしても、最終的な買い上げが期待できなければ、株価は低めに抑えられる。最終的に株価が高くなるのは、実現可能性が高いと多くの参加者が予測している提案になる。はてなアイデアのスナップショットを図4に示す。
このモデルでは、株式銘柄が要望の数だけ存在し、参加しているユーザ数(約4,000人)と比較してかなり多い。そのため、個々の銘柄について市場原理が完全に機能しているとは言えず、結果として株価が乱高下する状況も見られる。しかしながら、予測市場の導入によって参加者は運営者や他の参加者の視点を考慮するようになり、運営側としては良質な意見の集約、参加者としてはサービスへの参加感を得るなど、両者にとって良好な関係を築くことができている。
はてなでは、同じシステムを利用して、2005年の総選挙の結果予測を行う実験「総選挙はてな」を実施した。この場合の株式は各政党であり、配当は最終的な獲得議席数に比例するとしている。このような条件の下、約1ヶ月間の取引を行った結果を表2に示す。参加者は約1,000人である。
予測市場による議席数は、おおむね実際の結果と得票率の中間程度である。小選挙区制では得票率と獲得議席数が直接的に比例しないため、直感的な予測をすることが難しい。その意味で、予測市場は集合知の集約機能としてある程度有効であることがわかる。
| 党 | 予測議席数 | 獲得議席数 | 得票率(小選挙区) | 得票率(比例区) |
| 自由民主党 | 244(50.9%) | 296(61.7%) | 47.8% | 38.2% |
| 民主党 | 150(31.3%) | 113(23.5%) | 36.4% | 31.0% |
| 公明党 | 40(8.3%) | 31(6.5%) | 1.4% | 13.2% |
| 日本共産党 | 12(2.5%) | 9(1.9%) | 7.3% | 7.3% |
| 社会民主党 | 6(1.3%) | 7(1.5%) | 1.5% | 5.5% |
| 国民新党 | 4(0.9%) | 4(0.9%) | 0.6% | 1.7% |
| 新党日本 | 6(1.2%) | 1(0.2%) | 0.2% | 2.4% |
| その他・無所属 | 17(3.7%) | 19(4.0%) | 4.8% | 0.6% |
5. 総表現社会と集合知
「ウェブ進化論」では、Webの進歩によって誰もが表現の機会を与えられる「総表現社会」の実現可能性について議論されている[7]。すでに、ブログやSNSを利用した表現活動、コミュニケーション活動は本格的な普及の段階にあり、この傾向は今後も続くものと思われる。表現形式についても多様化が進み、テキストだけではなく、画像、音声、映像を用いた表現を容易に作成、公開することが可能になった。
その中で、個々の表現活動が関連し合い、あたかも集団で大規模な創作活動が行われているように見える現象が生まれている。また、このような現象を明確に意識した集合的表現の活動や、それらを支援するシステムが作られている。
集合的表現が受け入れられている例として、匿名掲示板「2ちゃんねる」におけるアスキーアートが挙げられる。アスキーアートは文字データであることから、特別なツールを必要とせず容易に改変が可能である。これまでに様々なキャラクターが生み出され、そのバリエーションは膨大な数に上る。
安斎らは、「連画」と呼ばれる表現活動を行っている。連画は、複数人の作家がインターネットを通じて交互に絵を加筆させていく過程を見せるものである。現在では、これを発展させ、ワークショップ形式で多人数が連画を行う「カンブリアンゲーム」を開催している。カンブリアンゲームの参加者は、絵や写真の作成時に、どの作品から影響を受けたかを明示する。その結果、図5に示すような作品のネットワークが形成される。
音楽の分野では、Appleの音楽作成ツール「GarageBand」を中心としたコミュニティが立ち上がっている。GarageBandには、フレーズ単位の音声データを組み合わせて音楽を作る機能がある。この機能を利用して、ミュージシャン同士が自身で作成した音声データを公開し、交換しながら楽曲の作成を行っている。プロのミュージシャンが自身の楽曲を同様の形式で配布した例もあり、その楽曲データを利用した編曲コンテストなども開かれている。
こういった集合的表現を念頭に置いて開発されたツールが「NOTA」や「Willustrator」である。NOTAは、ブラウザ上で Webページを簡便に作成できるオーサリングツールである。NOTAでは、ページ上のすべての要素(文字・図・写真など)がオブジェクトとして管理されており、このオブジェクトは他のユーザが自身のページにコピーすることができる。オブジェクトには元の作成者情報が保存されているため、追跡することができる。一方、Willustratorは、同じくWebブラウザ上で利用可能なドローツールである。Willustratorで制作されたデータはすべて Web上で管理され、ユーザは他のユーザが過去に制作した作品を修正し、新たな作品として登録することができる。
両システムともに、制作活動と共有という行為がシームレスにつながっている。成果はすべて共有され、次の制作に利用される。これによって、一から作品を作ることが得意でない人にとっても、既存の作品の改変という形で新たな表現の機会が与えられる。
以上のように、コンテンツを再利用しながら新たな作品を制作するというプロセスが、徐々に受け入れられている。しかしながら、このプロセスが広く機能するためには、引用元のコンテンツの権利処理や、意図しない再利用を抑えるような仕組みが必要である。
Creative Commons(CC)では、法律学の立場からコンテンツの流通を活性化させるためのライセンス策定・普及活動が進められている[8]。CCの特徴は、契約の文面として定義されているだけではなく、デジタル化された文書に付加できるよう、メタデータを定義している点である。実際に、MovableTypeなどのブログツールや、Flickrなどの代表的なコンテンツ共有サービスでは、ユーザがCCを容易に付加できるようなインターフェイスが用意されている。現在、CCが付加されたコンテンツの総数は1億4000万にのぼり、GoogleやYahoo!ではこれらのコンテンツのみを検索できるオプションがある。また、米国の「Jumpcut」では、Web上での映像編集ツールを提供し、CCが付加された映像同士をつなぎ合わせて新たな映像を作ることができるようになっている。
6. 参加のアーキテクチャ
本稿では、Web上に存在する集合知の事例をいくつか取り上げてきた。集合知には自己組織的に生み出されるものもあれば、参加者間の共同作業によって得られるものもあり、一律に定義することはできない。これらに共通するのは「参加のアーキテクチャ」が適切に設計され、多くの参加者を巻き込んだ結果である、という1点である。
参加のアーキテクチャを設計するにあたっては、その目的に応じて、参加者の役割やコミュニケーションの方法を決める必要がある。参加者の独立性をどのように確保するかや、権限管理の有無など、検討すべき項目は多い。最終的には、参加者をどの程度信頼するかという、人間そのものに対する洞察も必要となる。信頼は、その定義上投機的なものであるため、何らかのシステムによって自動的に解決するものではない。性善説にのみ依拠するのではなく、コミュニティに貢献することが最もコストの低い状態になるようにシステムおよび制度の設計を行うことが重要である。
さまざまな課題はあるが、集合知は適材適所で大きな力を発揮する。ごく最近では、集合知を積極的に利用して問題解決を図るという意味の「Crowdsourcing」という言葉も生まれており、今後さまざまな応用が出てくることが期待される。
参考文献
[1] O'Reilly, T.: What Is Web 2.0: Design Patterns and Business Models for the Next Generation of Software, (2005).
[2] Powers, J.: The Wisdom of Crowds: Why the Many Are Smarter Than the Few and How Collective Wisdom Shapes Business,Economies, Societies and Nations, Doubleday (2004).
[3] Page, L., Brin, S., Motwani, R. and Winograd, T.: The PageRank Citation Ranking: Bringing Order to the Web, Technical report, Stanford University (1998).
[4] Keller, R., Wolfe, S., Chen, J., Rabinowitz, J. and Mathe, N.: A Bookmarking Service for Organizing and Sharing URLs, Proceedings of the Sixth International Conference on World Wide Web, pp.1103-1114 (1997).
[5] Giles, J.: Internet encyclopaedias go head to head, Nature, Vol.438, pp.900-901 (2005).
[6] Raymond, E.: The Cathedral & the Bazaar: Musings on Linux and Open Source by an Accidental Revolutionary, O'Reilly & Associates (1999).
[7] 梅田望夫:ウェブ進化論,筑摩書房 (2006).
[8] Lessig, L.: The Future of Ideas: The Fate of the Commons in a Connected World, Random House (2001).
----
本論文は非公式バージョンです。学術論文へ引用される場合には、必ず「情報処理」2006年11月号掲載の論文をご参照ください。(大向一輝: Web2.0と集合知, 情報処理, Vol.47, No.11, pp.1214-1221, 2006.)