論文メモ:小野 智弘ほか. 情報・コンテンツのレコメンド技術と課題.
アクセスログの分析の先に何をしたいか考えたとき、やりたいことは情報検索の支援だと改めて思ったので、関連技術の一つとしてレコメンド技術について調べてみることにしました。という訳で、レコメンド技術の概要を把握するために下記の論文を読んでみました。本文はCiNii Articlesで公開されています。
書誌事項
小野 智弘, 麻生 英樹, 本村 陽一. 情報・コンテンツのレコメンド技術と課題. 電子情報通信学会誌. 2011, vol. 94, no. 4, p. 310-315.
レコメンドシステムの手法と2010年の国際会議RecSys2010における研究動向、AmazonやYou tubeなど実サービスで利用されているレコメンド手法の概説、パーソナル情報を利用したサービスに対するユーザーの受容性調査の結果が解説されています。
章立て
- はじめに
- レコメンド技術の分類と最新動向
- レコメンドシステムの実用化事例
- パーソナル情報利用サービスの受容性調査
- おわりに
各章のメモ
- はじめに
- 膨大なコンテンツの中から、ユーザーのし好やニーズにあったものを提供するサービスとして、検索(サーチ)と推薦(レコメンド)がある。
- サーチとレコメンドの境界はあいまいだが、ユーザーのし好を提案する内容に反映させるのはレコメンド固有の技術。
- レコメンド技術の分類と最新動向
- レコメンド技術は履歴ベースの手法と属性ベースの手法に大別される。
- 履歴ベースの手法
- ユーザーによる過去のコンテンツの利用・評価履歴データのみを用いる手法(ソーシャルフィルタリング・協調フィルタリング)
- 利点:評価値しか必要としない
- 利点:明示的な属性では捉えられない潜在因子を利用できる
- 問題点:評価履歴が存在しないユーザー、コンテンツについては平均値予測しか使えない
-
- 属性ベースの手法
- 履歴データに加えて、ユーザーの属性(性別、年齢、ライフスタイル等)やコンテンツの内容に関わる情報(メタデータやレビューから抽出したキーワド等)を利用する手法
- 利点:評価履歴が存在しないユーザー、コンテンツでも属性が分かれば評価値推測が可能
- 問題点:ユーザーやコンテンツの内容に関する情報を収集する必要がある
- 問題点:属性が不適切だと精度がでない
- 属性ベースの手法
-
- 研究動向
- プライバシーを保護しつつ精度の良いレコメンドを行う方法
- 評価値をベースとせずに順位付け情報を扱う方法
- セレンディピティの確保
- し好の状況依存性への対処
- ユーザーの認知負荷を考慮した推薦結果の提示法の探求
- グループ推薦やパッケージ推薦などの、一定の制約を満たしながら複数のコンテンツを推薦する方法
- 研究動向
- レコメンドシステムの実用化事例
- Amazon
- Item-to-item Collaborative Filtering方式(2003時点)
- 類似商品の算出をあらかじめオフラインで実施しておき、履歴を用いたレコメンド処理のみをリアルタイムで実行することで、スケーラブルな対応を実現している
- You tube
- コンテンツ間の類似度を頻出同時アクセスパターンのカウントによって求める方法をベースとしつつ、人気作品に偏らない工夫や類似した作品になりすぎない工夫をしている
- 推薦理由の提示機能、ユーザー自信によるレコメンド内容のコントロール機能などの受容性向上施策
- 複数のインターフェイスや画面デザインを用意して、推薦システムを運用しながら、推薦結果のCTR(Crick Through Rate)が良いモノを選んでいくといったA/Bテストを日常的に実施しながら向上を計っている。
- 他社Webサイト上へレコメンド機能をSaaS型で提供する企業の出現
- Amazon
- パーソナル情報利用サービスの受容性調査
- KDDI研究所、KDDI総研、産業技術総合研究所の共同プロジェクトの一環として行った調査分析
- 年齢や性別などの属性情報については半数以上のユーザーが利用されることに抵抗がない、少ないと応えている
- Webサイトの利用履歴については18%、実世界の移動履歴については13%と抵抗感が強まっている。
- 事業者への信頼度やユーザーのプライバシー懸念などが要因として考えられる
- レコメンドで利用している情報をユーザー自身が確認したり、コントロールできると、情報の開示意向が増加。
- KDDI研究所、KDDI総研、産業技術総合研究所の共同プロジェクトの一環として行った調査分析
メモ
- 高校数学から勉強しましょう…。
- 「ユーザーの認知負荷を考慮した推薦結果の提示法の探求」の元文献をあたる。
- Summonにレコメンド機能を付加するとしたら?
- APIを利用して、検索結果の表示順などの調整。
- ヘッダー部分にJavascriptの埋め込みは出来そうなので、Summon上にレコメンドするアイテムやキーワードを表示
- あとは、ブラウザアドオンの開発、SS社へ要望とか
- 大学図書館で技術的な面だけに注目してレコメンドに利用できそうな情報は、履歴(貸出履歴、EJへのアクセス、検索語)、属性(身分、学部、学年)とかかな。
レコメンドをテーマにすると決めているわけではないので、もう少しいろいろ幅広く情報検索をテーマに考えてみたいと思います。
国内図書館でのレコメンドサービスに関連した文献(未完)
まだ、本格的に調査してないので、網羅的なものではありません。もう少し整理して別項でたてる予定です。CiNii ArticlesからRefWorksへのダイレクトエクスポートで、複数著者の情報も出力してくれると嬉しいです。(現在は、筆頭著者のみ)
- 池田 大輔, 安東 奈穂子, 田中 省作. ディジタルライブラリにおける履歴・個人情報の保護及び利用 : 新たな電子図書館サービス構築へ向けた個人情報保護モデル. ディジタル図書館. 2005, no. 27, p. 1-8.
- 岡本 真. Web2.0時代の図書館-Blog, RSS, SNS, CGM(<特集>図書館とWeb2.0). 情報の科学と技術. 2006, vol. 56, no. 11, p. 502-508.
- 當山 仁健. 利用者のプロフィールを考慮した連想検索OPACの構築(<特集>図書館とWeb2.0). 情報の科学と技術. 2006, vol. 56, no. 11, p. 520-525.
- 安東 奈穂子, 池田 大輔. 新個人認証システムPersonal IDが変える図書館の個人情報管理 : 個人情報やプライバシーに配慮した一歩先行く図書館サービスとは. 大学図書館研究. 2007, vol. 81, p. 26-41.
- 渡邉 斉志. 知的自由の陥穽:利用情報保護思想が公立図書館に及ぼす影響の分析. Library and information science. 2007, vol. 0, no. 58, p. 103-115.
- 常川 真央, 小野 永貴, 安西 慧, 矢ヶ部 光. 利用者のつながりを創り出すコミュニティ指向型図書館システム(セッション1,学生チャレンジ特集). 情報処理学会研究報告. 情報学基礎研究会報告. 2008, vol. 2008, no. 34, p. 1-6.
- 原田 隆史. 図書館の貸出履歴を用いた図書の推薦システム (「ディジタル図書館」ワークショップ第36回 発表論文). ディジタル図書館. 2009, no. 36, p. 22-31.
- 山口 真也. 個人情報保護制度における「貸出記録」の位置付け--タイトル情報と思想信条との関係を中心に. 図書館学. 2009, p. 18-29.
- 原田 隆史, 増田 浩佑. 貸出記録を用いた図書推薦システムにおける重みづけの変更 (「ディジタル図書館」ワークショップ第38回 発表論文). ディジタル図書館. 2010, no. 38, p. 54-66.
- 岡本 真. 進化する図書館システム. マガジン航. 2010.1,
- 小野 永貴, 常川 真央. Web時代にあるべき未来の図書館サービスの胎動 貸出履歴の議論を超えたShizuku2.0の実現へ. 情報管理. 2010, vol. 53, no. 4, p. 185-197.
- 青砥 哲朗. 図書館の利用頻度を高めることを目的とした書籍レコメンドシステムの開発(<特集>データマイニングの活用). 情報の科学と技術. 2010, vol. 60, no. 6, p. 236-241.
- 岡本 真. 総論 : ソーシャルサービス活用 : これまでとこれから(<特集>ソーシャルサービス活用指南). 情報の科学と技術. 2011, vol. 61, no. 2, p. 52-57.
- 米田 渉. 成田市立図書館のWebサービスのコンセプト ([図書館問題研究会]第37回研究集会の報告). 図書館評論. 2011, p. 30-39.