テキスト解析

日本語形態素解析

リクエストURL
XML
http://jlp.yahooapis.jp/MAService/V1/parse

日本語文を形態素に分割し、品詞、読みがなの付与、統計情報を取得できる機能を提供します。

リクエストパラメータ

RESTリクエストの構築(GET)」および、「RESTリクエストの構築(POST)」をご参照ください。

パラメータ 説明
appid(必須) string アプリケーションID。詳細はこちらをご覧ください。
sentence(必須) string 解析対象のテキストです。
results(必須) string: ma, uniq 解析結果の種類をコンマで区切って指定します。
  • "ma": 形態素解析の結果を ma_result に返します。
  • "uniq": 出現頻度情報を uniq_result に返します。

無指定の場合は "ma" になります。
response string:
surface, reading, pos, baseform, feature
ma_response, uniq_response のデフォルト設定です。word に返される形態素情報をコンマで区切って指定します。
無指定の場合は "surface,reading,pos" になります。
filter string ma_filter, uniq_filter のデフォルト設定です。解析結果として出力する品詞番号を "|" で区切って指定します。

filterに指定可能な品詞番号:
  • 1 : 形容詞
  • 2 : 形容動詞
  • 3 : 感動詞
  • 4 : 副詞
  • 5 : 連体詞
  • 6 : 接続詞
  • 7 : 接頭辞
  • 8 : 接尾辞
  • 9 : 名詞
  • 10 : 動詞
  • 11 : 助詞
  • 12 : 助動詞
  • 13 : 特殊(句読点、カッコ、記号など)
ma_response string ma_result 内の word に返される形態素情報をコンマで区切って指定します。無指定の場合 response の指定が用いられます。
ma_filter string ma_result 内に解析結果として出力する品詞番号を "|" で区切って指定します。無指定の場合 filter の指定が用いられます。
uniq_response string uniq_result 内の word に返される形態素情報をコンマで区切って指定します。無指定の場合 response の指定が用いられます。
uniq_filter string uniq_result 内に解析結果として出力する品詞番号を "|" で区切って指定します。無指定の場合 filter の指定が用いられます。
uniq_by_baseform string このパラメータが true ならば、基本形の同一性により、uniq_result の結果を求めます。

サンプルリクエストURL

http://jlp.yahooapis.jp/MAService/V1/parse?appid=<あなたのアプリケーションID>&results=ma,uniq&uniq_filter=9%7C10&sentence=%E5%BA%AD%E3%81%AB%E3%81%AF%E4%BA%8C%E7%BE%BD%E3%83%8B%E3%83%AF%E3%83%88%E3%83%AA%E3%81%8C%E3%81%84%E3%82%8B%E3%80%82


サンプルコード

日本語形態素解析を使用したサンプルコードです。




レスポンスフィールド

日本語形態素解析のスキーマの記述は、以下のURLをご覧ください。
http://jlp.yahooapis.jp/MAService/V1/parseResponse.xsd

フィールド 説明
ResultSet 解析結果のすべてを含みます。
ma_result 形態素解析の結果を含みます。
uniq_result 形態素解析の結果から同一形態素の出現数を求めたものを返します。
total_count 形態素の総数を返します。
filtered_count フィルタにマッチした形態素数を返します。
word_list 形態素のリストを返します。
word 形態素を返します。
surface 形態素の表記を返します。
reading 形態素の読みがなを返します。
pos 形態素の品詞を返します。
baseform 形態素の基本形表記を返します。活用のない形態素の場合は省略されます。
feature 形態素の全情報を文字列で返します。
count uniq_result 中の word 内に現れる、形態素の出現数を返します。



サンプルレスポンス

以下は、sentence=庭には二羽ニワトリがいる。 のリクエストに対するレスポンスです。

<?xml version="1.0" encoding="UTF-8" ?>
<ResultSet xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="urn: yahoo:jp:jlp" xsi:schemaLocation="urn:yahoo:jp:jlp
http://jlp.yahooapis.jp/MAService/V1/parseResponse.xsd">
  <ma_result>
    <total_count>9</total_count>
    <filtered_count>9</filtered_count>
    <word_list>
      <word>
      <surface>庭</surface>
      <reading>にわ</reading>
      <pos>名詞</pos>
      <baseform>庭</baseform>
      </word>
      <word>
      <surface>に</surface>
      <reading>に</reading>
      <pos>助詞</pos>
      <baseform>に</baseform>
      </word>
      <word>
      <surface>は</surface>
      <reading>は</reading>
      <pos>助詞</pos>
      <baseform>は</baseform>
      </word>
      <word>
      <surface>二</surface>
      <reading>2</reading>
      <pos>名詞</pos>
      <baseform>2</baseform>
      </word>
      <word>
      <surface>羽</surface>
      <reading>わ</reading>
      <pos>名詞</pos>
      <baseform>羽</baseform>
      </word>
      <word>
      <surface>ニワトリ</surface>
      <reading>にわとり</reading>
      <pos>名詞</pos>
      <baseform>ニワトリ</baseform>
      </word>
      <word>
      <surface>が</surface>
      <reading>が</reading>
      <pos>助詞</pos>
      <baseform>が</baseform>
      </word>
      <word>
      <surface>いる</surface>
      <reading>いる</reading>
      <pos>動詞</pos>
      <baseform>いる</baseform>
      </word>
      <word>
      <surface>。</surface>
      <reading>。</reading>
      <pos>特殊</pos>
      <baseform>。</baseform>
      </word>
    </word_list>
  </ma_result>
  <uniq_result>
    <total_count>9</total_count>
    <filtered_count>5</filtered_count>
    <word_list>
      <word>
      <surface>庭</surface>
      <reading>にわ</reading>
      <pos>名詞</pos>
      <baseform>庭</baseform>
      <count>1</count>
      </word>
      <word>
      <surface>二</surface>
      <reading>2</reading>
      <pos>名詞</pos>
      <baseform>2</baseform>
      <count>1</count>
      </word>
      <word>
      <surface>羽</surface>
      <reading>わ</reading>
      <pos>名詞</pos>
      <baseform>羽</baseform>
      <count>1</count>
      </word>
      <word>
      <surface>ニワトリ</surface>
      <reading>にわとり</reading>
      <pos>名詞</pos>
      <baseform>ニワトリ</baseform>
      <count>1</count>
      </word>
      <word>
      <surface>いる</surface>
      <reading>いる</reading>
      <pos>動詞</pos>
      <baseform>いる</baseform>
      <count>1</count>
      </word>
    </word_list>
  </uniq_result>
</ResultSet>



エラー

日本語形態素解析はYahoo! JAPAN Web APIに共通のエラーメッセージおよびコードを返します。




利用制限

日本語形態素解析Web APIは、24時間以内で1つのアプリケーションIDにつき50000件のリクエストが上限となっています。また、1リクエストの最大サイズを100KBに制限 しています。詳しくは「利用制限」をご参照ください。