超漢字検索のこと
「超漢字検索」というアプリケーション・ソフトがあります。コンピュータを新機種に乗り換える時に私が真っ先にインストールするアプリです。これがなければ仕事にならないと言っても過言ではありません。もともとはTRONというOS(オペレーティング・システム)で作動する「超漢字」の中のもの(文字検索)ですが、Windowsベースに置き換えられたアプリケーションです。パーソナルメディア社が販売しており、以下のサイトよりダウンロードできます。10日間の限定ですが試用版として全ての機能を無料で使うことができます。ライセンス・キー(6,000円)を購入することで、そのまま使い続けることができます。Windows版とLinux版の他にiOS版とAndroid版もあるようです。「超漢字」については別稿で示しますが、日本発信のOSになるはずだったBTRON(ビジネスTRON)で動く一連のアプリケーション群です。その後のBTRONはWindows上に作った仮想マシン(VM)のOSとして動くようになったため、見た目はWindowsのアプリケーションのようになりましたが、現在も生き続けています。

http://www.chokanji.com/ckk/

この「超漢字検索」の検索方法はユニークです。他のアプリケーションで同じような検索システムが用いられているかどうか知りませんが、漢字を構成する部品を手掛かりとして、知りたい漢字を探し出すというものです。何かの作業中に知らない漢字に遭遇する時がありますが、通常の漢字変換で出てこなければお手上げです。キーボードから入力することができません。部首で検索する方法がありますが、それを知っている人は多くないでしょう。人名を扱う時が典型的なので、架空の名前として「戳太郎」という人がいたとします。「超漢字検索」では「部品による検索」が可能と書きました。例えばこの「戳」を構成する部品として「羽」があります。検索画面で「羽」と入れれば候補漢字が選び出されてきますが、これだけだと候補漢字数が多すぎます。次のような画面が15面も出てきます。ここから探し出すのは大変です。



ユニークな点として「引き算」ができるということがあります。例えば「曜-日」という引き算により「曜の右半分」が部品として利用できます。検索画面で「曜-日」と入力すると候補が絞られます。この条件で表示される漢字は全部で226個あります。





数は多いのですがWindowsで使うことができる漢字は最初の方に示されます。黒色はJIS第1および第2水準、水色はJIS第3水準、緑色はJIS第4水準の漢字です。この場合は黒色が10種類しかないので、ここからだと選ぶのは容易です。その10種類とは、「濯」、「擢」、「躍」、「曜」、「耀」、「戳」、「櫂」、「燿」、「糴」、「糶」です。この「戳」を左クリックすると、漢字の情報が表示されます。この漢字をコピーして、使いたいワープロ上でペースト(貼り付け)すると、自分のワープロ文書に取り込むことができます。「戳」の読みは「たく」です。人名の場合は必ずしもこの読み方でない場合がありますが、このように漢字を構成する部品を頼りにして、その漢字の情報に到達する事ができます。漢字コードには区点表示とかJIS、シフトJISとか色々ありますが、それぞれのコードの何番に相当するかという情報も出てきます。関連漢字として異体字も表示されます。中国漢字も表示されますから、それが簡体字であれば簡体字として表示されます。

ここで表示される異体字や簡体字は「超漢字検索」の中で見ることが出来ますが、黒色・水色・緑色で表示されている漢字以外はWindowsシステムで使えません。この3色は「日本基本」、また紺色は「日本補助」として使えるかもしれません。これらの異体字や簡体字はWindowsシステムでは通常の漢字として扱ってないため、どうしても使いたければ「外字」として表示するしかありません。最初に「超漢字」のことを書きました。「超漢字」の動作環境TRONでは「超漢字検索」で表示される漢字はすべて「トロン・コード」で管理されます。従ってシステムとして利用が可能です。システムとして可能というのは、「外字扱いではない」ということです。多少の重複を気にせず存在が確認される漢字を全て収録するというのがトロン・コードの設計思想です。従って「超漢字システム」の中であれば、ワープロでも表計算でも、図表の中でも使うことが出来ます。人の名前を管理しなければならない時には重宝します。トロン・コードには、現存する唯一の象形文字であるトンパ文字も収録されています。トンパ文字については後でも触れます。「超漢字」というのは、漢字を自在に扱えるという特徴をアピールするための名前と言えますが、ネットワーク式のファイル管理システムや、実身と仮身の使い方次第ではシステム自体がハイパーテキストをサポートしている事になり、他のOSとは全く異なっています。実用性が無ければ誰もしないと思いますが、スタートレックに登場する架空言語のクリンゴン文字を登録することも理論的には可能です。トロン・コードには新文字登録の余裕が十分にあります。

検索には論理演算が可能です。すなわち検索用の部品をスペース(空白)をはさんで並べると「AND検索」となります。検索の方法はパズルのようであり、思いつくままでかまいません。「戳」の例では条件を「羽 戦-単」とすると、37個に絞り込むことが出来ます。さらに「羽 戦-単 集-木」とか、「曜-日 戦-単」とした場合は「戳」しかありません。



検索には記号を使うこともできます。大概の場合は形が似ていればOKです。例えば「※」で検索すると「鬱」を含めて389個の漢字が出てきます。このうち1面(153個)だけ示します。



「※ 缶」と入力すると、「※」と「缶」が含まれた漢字が表示されます。この場合、「鬱」を含めた26個に絞られます。



「鬱」の中にはカタカナの「ヒ」のような部品が含まれます。「※ ヒ」と入力した場合は次のような80個の漢字が出てきます。



もうひとつ示します。「木」という部品が3個以上含まれる漢字を検索したい時は、検索画面に「木 木 木」と入れます。「木*3」でも構いません。「*」はコンピュータ上の演算(掛け算)の記号です。「木を3倍」するわけです。すると83個の漢字が出てきます。



「森」という漢字が重複して3個あります。形は同じですが、黒色の「森」は日本の標準的な漢字コードに含まれるもの、橙色の「森」は中国漢字のもの、紫色の「森」は韓国で用いられる漢字コードのものです。黒字の「森」をクリックすると、「日本漢字の森」の情報が表示されます。関連漢字として異体字が出てきますが、中でも面白いのはトンパ文字です。「森に関連したトンパ文字」が表示されます。



トンパ文字として3個出てます。それぞれを調べてみると、最初のものには「樹木の生い茂った深山」、2番目には「森」、3番目には「森を燃やす」という説明が書かれています。



この「超漢字検索」に慣れると各種の作業効率が上がるばかりでなく、文字に関して新しい発見があります。見たこともない漢字が検索結果に出てくることがあるからです。すでに書いたごとくTRONシステムの上なら、その文字をワープロや表計算シートの中で使うことが出来ますし印刷も可能です。これらをハイパーテキスト方式で繋げていくこともできます。

(附記)
(1)この稿で表現している「ハイパーテキスト方式」とは、例えばインターネットの表示にあるように、文中の特定の単語をクリックすると、別のページに次々と飛んでいく方式のことを言っています。
(2)検索は総画数でも可能です。「=64」と入れると64画の漢字が出てきます。見たこともない漢字が並びます。画数はアバウトでも構いません。「=34~37」と入れると、総画数が34以上かつ37以下の漢字が出てきます。
(3)Windowsで簡体字が使えるようです。UNICODEが対応しているからと思われます。
(4)文字検索の例を2つ追加します。




センター長  2020/07/22(Wed) 16:31:22
エクセルで自在なグラフを描く・その2
マイクロソフト社のエクセル(表計算アプリ)は、日付(年月日)を連続した数値として管理しています。Windows版のエクセルは1900年1月1日を「1」として(デフォルト状態)、マック版のエクセルは1904年1月1日を「1」としています。本来なら存在しないはずの1900年2月29日の取り扱いの違いのためです。マイクロソフト版は設定の変更により1904年1月1日とすることも可能のようです。これらは別稿で示しました。日付は整数で管理されていますが、小数点以下にも意味があります。小数点以下は、整数部分が示す年月日の中の「時間」を示します。1日は86,400秒(=24×60×60)ありますから、エクセルでは1秒を[1/86,400]という値で管理します。小数点以下11桁で四捨五入すると、1秒は[0.0000115741]です。具体例として図を示します。

2020年7月1日に24、7月4日に19、7月5日に35と変化する数値があったとします。この変化を「直線付きの相関図」で描くと次図のようになります。実はセルの中に年月日だけを書き込むと、その日の「0時0分0秒」を示しています。通常は時間のことなど考えないので、書き入れる必要が無いだけです。ちなみに1900年1月1日に「1」から始まった場合の「2020年7月1日」のシリアル値は「44,013」です。これは1900年1月1日から数えて、2020年7月1日が「44,013日目」に相当するという事です。エクセルが扱える最大年月日は西暦9999年12月31日の「2,958,465」です。



このグラフに時間指定のデータを追加すると次図のようになります。
2020年7月1日12時43分45秒、15
2020年7月3日08時12分23秒、33
2020年7月5日15時52分43秒、25
例えば「2020年7月1日12時43分45秒」のシリアル値は、小数点以下10桁まで表示すると「44,013.5303819444」です。

長い経過(時間軸)のグラフを描くのに「時分秒」は不要ですが、もし1日の中での変化を描きたいような場合には役立つと思います。セルに表示させる際に桁を揃えるには、セルの表示形式をユーザー定義で変えておくのが良いでしょう。年月日の場合は「yy/mm/dd」、時間の場合は「hh:mm:ss」です。両方が必要な場合は「yy/mm/dd hh:mm:ss」です。



この図では2本の曲線を描きましたが、これは系列を2個使用したという事です。前稿で示したイラストは98個の系列を使用していました。この系列の中のデータ数は(x,y)形式の数値が2個の場合が最低で、この場合は1本の直線になります。データ数が少ない場合でも1系列が必要です。エクセルの仕様として系列数の上限は255個です。この上限まで使用したグラフを次に紹介します。

札幌西円山病院の回復期リハビリ病棟では、2015年8月1日から2020年5月30日までに合計1525人の患者さんが退棟しました。回復期リハビリ病棟に入棟する患者さんの身体運動能力はFIMと言われる評価法で定められます。このFIMは、各項目が1~7点の評価で求められます。このうち運動関連の13項目の合計点が、病棟の機能を示す実績指数の計算に使用されます。このFIM運動項目合計点を、各患者が入棟してから退棟するまでの変化として描いてみました。入棟時と退棟時のデータですから、患者1人あたり1系列を使用する必要があります。エクセルの仕様のため255系列が上限ですから、退院患者全員について示すことはできません。仮にできたとしてもグラフが直線だらけになってしまい、個々のデータは判別できなくなります。そこで、2016年1月から半年ごとの1ヶ月間に退院した患者に絞り込んでグラフを描いてみました。各月の退院患者数は以下のごとくです。
2016年1月、24人
2016年7月、27人
2017年1月、14人
2017年7月、33人
2018年1月、25人
2018年7月、34人
2019年1月、30人
2019年7月、29人
2020年1月、28人
以上、244人となりました。別稿で書いたごとく「縦の補助線」も「系列」として利用してますから、これが10本で10系列あります。図の右上がりの黒実線は実績指数ですが、これが1系列。合わせてちょうど255系列となります。実のところ、これは偶然でした。ここまでのデータでグラフを描き終えた後、もうひとつ系列を増やそうとしても不可能なことに気が付きました。何か不具合が生じたのか?と思って調べたところ、エクセルの仕様として系列の上限が255個だという事が分かった次第です。



この図に描かれている各直線は、一人の患者を示します。その患者の入棟時の運動FIM合計点と退棟時の運動FIM合計点を直線で結んだものです。右上がりの直線は、FIM合計点が上昇、すなわち身体能力が向上したことを意味します。右下がりの直線は、入棟後に身体能力が低下してしまった症例です。運動関連の項目は13個ありますから、全てが最低の1点だとするとFIM合計の最低点は13点です。13個の項目が全て最高の7点だとすると、FIM合計の最高点は91点です。FIM合計点や変化量(利得)は左の縦軸(Y軸)を見れば分かります。横軸(X軸)は時間の流れ(年月日)です。たとえば横に広いデータは、入棟期間が長いことを示します。このように各データ(直線)は、横軸(日数)と縦軸(FIM利得)という2つのパラメーターで示されます。なだらかな傾きの場合は、入棟期間が長く、かつFIM利得が小さいことを意味します。急峻な傾きの場合は、入棟期間が短く、かつFIM利得が大きいことを示します。

このグラフの左半分(2016年1月~2018年1月)と右半分(2018年7月~2020年1月)を比べると、違いが明らかです。色々な理由がありますが、直近の2年間に西円山病院の回復期リハビリ病棟に入棟した患者さんの身体運動能力の改善度が大幅に向上したことが分かります。各データを横切って右上に向かう黒実線は実績指数(右副軸)を示します。これは回復期リハビリ病棟の実力を示す指標です。これも大幅に向上しているのが分かります。

[補足]
1系列の中のデータについて、(x,y)形式のデータが最低2組が必要と書きましたが、これは直線を描く場合のことです。作図としては1組でも成立します。この場合は線ではなくて「点」が1個だけ描かれます。また、データが複数の場合でも「線で結ばない相関図」とした場合は、データの数だけの「点」が描かれます。同じ系列だと同じ色の点になりますが、系列を変えることで別の色の点として分けることが出来ます。


センター長  2020/07/06(Mon) 21:08:30
ページトップへ