読者です 読者をやめる 読者になる 読者になる

感想:図書館員のためのプログラミング講座

NIIのWeb担当者研修に受講生として参加した際に、お世話になった山本哲也さんの著作が刊行されました。カーリルで開く!function(d,s,id){var js,fjs=d.getElementsByTagName(s)[0],p=/^http:/.test(d.location)?'http':'https';if(!d.getElementById(id)){js…

CiNii Books APIのJSON、クロスドメイン通信対応

10月11日にCiNii Books の改修がリリースされました。 http://ci.nii.ac.jp/info/ja/index_2013.html#20131011-3 内容説明や目次の検索機能の提供や著者名ヨミの表示といった機能が追加されていますが、Li:d tech的に熱いのは、CiNii Books APIのJSON対応や…

TreeTaggerを使った英語の形態素解析

課題で英語の形態素解析をする必要があったのでツール・インストール・Pythonからの利用についてメモ。日本語だとMeCabを使えばいいのですが。 Pythonで形態素解析 - よしなしごと英語だとTreeTaggerというツールがあるということです。Windows・Linux・Mac…

PythonのRequestsモジュールでCiNii Articlesのデータ取得

いままでPythonの標準モジュールのurllib2を使っていましたが、Requestsモジュールがとても便利だったのでメモ。 公式サイト Requests: 人間のためのHTTP — requests-docs-ja 1.0.4 documentation インストール pipやeasy_installでインストールできます。自…

はてなブログの評価指標 Hatena-Indexを実装しました

id:min2-flyのアイディアtitle=Hatena-Indexを実装してみました。*1どのくらい記事を書いているかと、どのくらいはてなブックマークされているかを表す指標になります。Hatena-IndexHatena-Indexの詳細はHatena-Index - かたつむりは電子図書館の夢をみるか…

GibbsLDA++でトピック分析

なぜか唐突にブログを同時更新使用みたいな話が決まってしまったので、無理矢理エントリを書いています。自然言語処理のトピックモデルの一つの手法であるLDAを使ってみました。 LDAについては以下のスライドが詳しいので、参照ください。LDA入門一部引用す…

Twitterネットワークの可視化

入門 機械学習の11章でTwitterのネットワーク可視化がトピックになっていて面白そうだったので、Pythonで作成してみました。*1某Q大の図書館のアカウントを分析してみました。*2大きく2つに分かれていて、左側が図書館関係のアカウント、右側が大学関係のア…

Twitter公開リストからフォローワー数ランキングを作成するWebアプリを作りました

id:kitoneの図書館公式Twitterアカウントのフォロワー数ランキング(大学図書館編) - ささくれ、図書館公式Twitterアカウントのフォロワー数ランキング - ささくれというエントリをうけて、ちょうどいいプログラミングの課題だと思い、Webアプリを作成して…

「集合知プログラミング」で図書館系ブログをクラスタリングしてみた

2013年2月12日 プログラム公開. 1月は1つもブログ記事を書きませんでしたが,本年もどうぞよろしくお願いします. 1月は温泉旅行に行ったり,体調崩してたり,図書館総合展フォーラム in 熊本に行ったりしていました.(熊本でお世話になって皆さまありが…

Pythonでtf-idf その二

Pythonで形態素解析 - よしなしごと Pythonでtf-idf その一 - よしなしごと の続きです.といってもあとはコードを書くだけだったので,書きました.ひたすらfor文でループを回しているので,とても遅そうですが….まあ今回は動けばいいやということで. 実…

Pythonでtf-idf その一

Pythonで形態素解析 - よしなしごとの続きです. 日本語出力ではまってしまった*1ので,今回はtfの算出までです.idfは週末に終わらせる予定…. tf-idfとは 索引語の重みづけの一種です.tfは"Term Frequency",idfは"Inverse Document Frequency"の省略で.…

Pythonで形態素解析

授業で,日本語文書を単語に切り分け索引語リストを作りtf-idfを求めよという課題が出たので,Pythonで取り組んでみることにしました.基本的には初心者なので,誤りなどあればご指摘いただければ幸いです. まずは日本語文書を形態素解析するために,オープ…