2016年09月25日

[PC]日本語MS−IMEへの辞書登録のつづき

 前回の投稿の追記にすでに書いてはいますが,今回はブログに書くネタが見つかりませんでしたので,日本語MS−IMEの辞書登録を利用してハングル入力を可能にする方法についてもう少し書こうと思います.

 本当なら,北朝鮮の核実験やミサイル開発に関することや,28日に施行される김영란(キム・ヨンナン)法(正式名称は「부정청탁 및 금품등 수수의 금지에 관한 법률」(不正請託および金品等の授受の禁止に関する法律)というそうです)の韓国社会への影響とか,キョンジュ(慶州)地震のその後の影響とか,Samsung Galaxy note 7の電池発火の問題がようやく落ち着いてきたこととか,いろいろ書いてみたいことはあるのですが,そんなことを扱えるほどの実力は,私にはまだありません….

 話を元に戻して,IMEの辞書登録機能についてですが,登録したいことばを読みと共に列挙したテキストファイルを用意すればたくさんのことばを一気に登録できて便利です.1語ずつ登録することもできますが,量が多いととても手間がかかります.登録する単語の読み,単語,品詞,コメントの4つ(コメントは省略できます)をタブ文字で区切って1行に書き,それを登録したいだけ何行も書いたテキストファイルを作成します.

 ふつうは日本語の単語を登録しますので,その場合,登録用ファイルはShift-JISという日本のパソコンで一般的に使われている文字コードで作成すればいいのですが,これですとハングルなど外国語の文字を含めることができません.そこで,さまざまな文字をひとつにまとめたUnicodeという文字コードを利用します.しかし,同じUnicodeでもUTF-8やUTF-16など,テキストファイルの文字コード形式が何種類か存在します.

 Unicodeでテキストファイルを作る際には,UTF-8が広く使われているようで,Google日本語入力の辞書登録機能ではUTF-8の登録ファイルが扱えます.MS−IMEでも同じだと思っていたのですが,何度試してもうまくいきませんでした.結局,MS−IMEではUTF-8のテキストファイルは扱えず,UTF-16が扱えることが分かりました.

 きのうからきょうにかけて,自作の登録ファイルの不具合を修正して,うまく登録できるか試してみました.そこまでは問題なかったのですが,登録ファイルの先頭に説明を書き加えようとしたところで問題が発生しました.行頭に‘!’(半角の感嘆符)を書くと,その行はコメントとして登録時には無視されるはずですが,それが原因でエラーになり登録できないことがありました.

 どのようにコメントを書くとエラーになるのか,少しずつ書き方を変えては登録することを繰り返して原因を特定しようとしたのですが,その法則性を掴めませんでした.確実にエラーを回避できる方法を見つけることができず,疲れて諦めてしまいました.

 それから,ファイルを登録するための「辞書ツール」を見つけるのも多少面倒です.MS−IMEの言語バーに,「ツール」という道具箱のようなアイコンが表示されていれば,そのメニューから簡単に起動できますが,そうでない場合は「辞書ツール」にたどり着くまでがちょっと大変です.

 WindowsキーとRキーを同時に押すと表示される「ファイル名を指定して実行」の機能を使うと,どんなプログラムでも一発で起動できるのですが,「辞書ツール」の起動では,プログラムを指定する文字列が長くなるのが難点です.そこで,湾クリックで起動できるよう,公開した登録ファイルに「辞書ツール」へのショートカットを同梱することを考えています.

 環境によってはうまく動作しないかもしれませんが,Windows7用とWindows10用の2つのショートカットを作りましたので,これから公開中のzipファイルに追加しようと思います.

【2016.9.26 追記】

 ショートットを追加したzipファイルを作成しました.サイトにアップロードしましたが,ダウンロードできないことがあるようですので,こちらのブログにも載せておきます.

MS-IME_Dic_2BeolsikHangul_UTF-16_v2.00.zip
posted by kajiritate webmaster at 23:59| Comment(0) | 日記