MeCab

MeCabオープンソース形態素解析エンジンで、奈良先端科学技術大学院大学出身、現GoogleソフトウェアエンジニアでGoogle 日本語入力開発者の一人である工藤拓[1][2]によって開発されている。名称は開発者の好物「和布蕪(めかぶ)」から取られた。

MeCab
開発元 工藤拓
最新版
リポジトリ
プログラミング
言語
C++C言語C#, Java, PerlPythonRuby
プラットフォーム クロスプラットフォーム
種別 形態素解析エンジン
ライセンス GPLLGPLBSD
公式サイト https://taku910.github.io/mecab/

開発開始当初はChaSenを基にし、ChaSenTNGという名前で開発されていたが、現在はChaSenとは独立にスクラッチから開発されている。ChaSenに比べて解析精度は同程度で、解析速度は平均3-4倍速い。

品詞情報を利用した解析・推定を行うことができる。MeCabで利用できる辞書はいくつかあるが、ChaSenと同様にIPA品詞体系で構築されたIPADICが一般的に用いられている。

MeCabはGoogleが公開した大規模日本語n-gramデータの作成にも使用された[3]

Mac OS X v10.5及びv10.6SpotlightiPhone OS 2.1以降とOS X Yosemite以降の日本語入力にも利用されている[4][5][6]

脚注

  1. 「ググる」の精度を高めるために必要なもの - @IT自分戦略研究所”. ITmedia (2006年3月15日). 2009年4月9日閲覧。
  2. 思いどおりの日本語入力 - Google 日本語入力”. Google (2009年12月3日). 2009年12月3日閲覧。
  3. Google Japan Blog: 大規模日本語 n-gram データの公開”. Google (2007年11月1日). 2009年4月9日閲覧。
  4. 大規模テキスト処理を支える形態素解析技術(工藤拓氏・Google) (2009年12月3日). 2009年12月3日閲覧。
  5. iPhoneの仮名漢字変換はMeCabを利用 (2009年12月3日). 2008年9月18日時点のオリジナルよりアーカイブ。2009年12月3日閲覧。
  6. 「日本語入力」の基本”. MacFan. 2020年5月30日閲覧。

外部リンク

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.