ユーザ辞書エントリの追加 仕様
機能概要
リクエストの params/context 以下に、ユーザ辞書エントリを指定することで、ユーザ辞書を使った形態素解析を行うことができます。
ユーザ辞書とは、1つの形態素にまとめたい場合や解析誤りを直したい場合に利用者側で独自に作成するもので、例えば、新語やブランド名、専門用語などが挙げられます。
なおリクエスト時に指定するユーザ辞書エントリは、そのリクエストのみで有効となります。
他の呼び出しや次回以降の呼び出しには直接影響しませんので、必要に応じて都度指定してください。
仕様
必須のリクエストパラメータに加え、params/context 以下に entriesも指定します。
- params/context/entries:ユーザ辞書エントリ(string)を配列(array)で指定
- ユーザ辞書エントリ(string):"表記" または "表記,読み" の形式で指定
詳しくは、下記のリクエストサンプルもご覧ください。
リクエスト/レスポンス サンプル
ユーザ辞書機能を使わない場合
params/context/entries を指定しない場合の例です。
この例をベースに、【ケース1】【ケース2】でユーザ辞書エントリを指定した例を示します。
リクエスト
{
"jsonrpc": "2.0",
"id": 1,
"method": "jlp.maservice.parse",
"params": {
"q": "東京スカイツリーから外濠公園が見えた。"
}
}
レスポンス
{
"id": 1,
"jsonrpc": "2.0",
"result": {
"tokens": [
["東京","とうきょう","東京","名詞","地名","*","*"],
["スカイ","すかい","スカイ","未定義語","カタカナ","*","*"],
["ツリー","つりー","ツリー","名詞","普通名詞","*","*"],
["から","から","から","助詞","格助詞","*","*"],
["外","がい","外","名詞","普通名詞","*","*"],
["濠","ごう","濠","名詞","普通名詞","*","*"],
["公園","こうえん","公園","名詞","普通名詞","*","*"],
["が","が","が","助詞","格助詞","*","*"],
["見えた","みえた","見える","動詞","*","母音動詞","タ形"],
["。","。","。","特殊","句点","*","*"]
]
}
}
"東京/スカイ/ツリー/" や "外/濠/公園/"の形態素解析結果となっています。
【ケース1】"表記" をユーザ辞書に指定した場合
params/context/entries に "表記" を文字列の配列として指定します。
下記では、"東京スカイツリー" と "外濠公園" をユーザ辞書として指定しています。
リクエスト
{
"jsonrpc": "2.0",
"id": 1,
"method": "jlp.maservice.parse",
"params": {
"q": "東京スカイツリーから外濠公園が見えた。",
"context": {
"entries": [
"東京スカイツリー",
"外濠公園"
]
}
}
}
レスポンス
{
"id": 1,
"jsonrpc": "2.0",
"result": {
"tokens": [
["東京スカイツリー","とうきょうすかいつりー","東京スカイツリー","名詞","固有名詞","*","*"],
["から","から","から","助詞","格助詞","*","*"],
["外濠公園","はずごうこうえん","外濠公園","名詞","固有名詞","*","*"],
["が","が","が","助詞","格助詞","*","*"],
["見えた","みえた","見える","動詞","*","母音動詞","タ形"],
["。","。","。","特殊","句点","*","*"]
]
}
}
"東京スカイツリー" と "外濠公園" がそれぞれ1つの形態素として解析されるようになりました。
また "東京スカイツリー" の読みは合っていますが、自動で補った "外濠公園" の読み("はずごうこうえん")は誤っています。(正しくは "そとぼりこうえん" と読みます )
区切りだけが欲しい場合はこれで良いですが、読みも修正したい場合は下記の【ケース2】をご覧ください。
【ケース2】"表記,読み" をユーザ辞書に指定した場合
params/context/entries に"表記,読み"を文字列の配列として指定します。
下記では、【ケース1】に加え、外濠公園の読み("そとぼりこうえん")も追加しています。
リクエスト
{
"jsonrpc": "2.0",
"id": 1,
"method": "jlp.maservice.parse",
"params": {
"q": "東京スカイツリーから外濠公園が見えた。",
"context": {
"entries": [
"東京スカイツリー",
"外濠公園,そとぼりこうえん"
]
}
}
}
レスポンス
{
"id": 1,
"jsonrpc": "2.0",
"result": {
"tokens": [
["東京スカイツリー","とうきょうすかいつりー","東京スカイツリー","名詞","固有名詞","*","*"],
["から","から","から","助詞","格助詞","*","*"],
["外濠公園","そとぼりこうえん","外濠公園","名詞","固有名詞","*","*"],
["が","が","が","助詞","格助詞","*","*"],
["見えた","みえた","見える","動詞","*","母音動詞","タ形"],
["。","。","。","特殊","句点","*","*"]
]
}
}
"はずごうこうえん" となっていた読みが、"そとぼりこうえん" に修正されました。