“文章”をめぐる状況とSAI開発の背景

1.日本語の文章を取り巻く状況

  一口に日本語の文章といっても、小学生が書く作文や携帯電話のメール文、日記や友人との打ち合わせ、そして学術論文や小説、詩、シナリオなど多種多様な形態があります。読み手が自分か、他人か。同じ他人でも友人や仲間なのか、仕事上の同僚や上司、取引先か、専門分野が同じか、異なるのかなどによっても、文章を変える必要があります。
  そうした文章の中で、現在、最も問題視されているのが、他の人に事実を伝えたり、自分の主張を論理的に書こうとしたりした文章です。具体的には、学生やビジネスパーソンが書くレポート、報告書、提案書、学術論文などです。
  ではいったい、どんな問題があるのでしょうか。
  • 思いついた文章をだらだらと書き連ねるため、主語と述語が一致しない文が多い
  • 代名詞が何を指しているのか、理解できない
  • 読めるのだが、”そして”や”また”などの接続詞、”される”といった受身形を多用していて、文章にまとまり感がない
  • 読み手の立場で係り受けを使っておらず、しかも語尾の統一感がばらばら
  • よく知らない専門用語が頻出し、理解するのに苦労する
・・・問題点を挙げると、枚挙にいとまがないほどです。
  背景には、新聞や本、雑誌などを読まない人が増えた、きちんとした文章を書く機会が少なくなったといった事情があり、簡単には解決できません。それどころか、文章力は悪化の方向に向かっています。例えば高校や大学などの教育機関。テストの際に記述式や論文系の問題を出すと採点に手間がかかるという理由から、穴埋めや選択式の問題にシフトする傾向が年々、強まっています。企業でも部下に報告書を書かせる際に、「箇条書きでOK」「プレゼンテーションソフトを使って図式化すればいい」といった慣習が広がりつつあります。「文章の形式をとった報告書が必要なら、上司が箇条書きの報告を見て文章を書く。その方が仕事を早く終えられる」というわけです。
  こうした風潮に対し、「教師や企業のマネジャーは一体、何を考えているのか。文章指導も仕事のうちだろう」と非難するのは簡単です。しかし教師やマネジャー自身、文章力に自信がない場合がありますし、そうでなくても年々増える業務をこなしていくために懇切丁寧に指導している余裕がないのが実情です。

2.SAI の開発方針と特徴

  そこでザ・ネットは、自動的に文章を診断し、問題を指摘しながら文章力向上を支援するサービス、「SAI 」を開発しました。開発の基本方針は大きく分けて3つあります。一つは、教師や上司など人の手を煩わせないこと。利用者(学習者)自身が、コンピュータ・ネットワーク上で書く力を磨けるようする必要があります。第2は、トライ&エラーを繰り返せるようにすること。これには文章の診断(問題指摘)に要する時間の短縮が鍵を握ります。もう一つが、診断結果を分かりやすくすることです。「指摘事項は理解できなくはないが、どこを直せばいいか分からない」。こういった疑問を極小化する必要があるのです。
これらの方針の下で開発を継続した結果、SAI は
  • 利用者(学習者)が書いた文章を入力後、通常1分以内で文章診断が完了する。事実上、リアルタイムで診断結果が出るので、利用者はすぐに文章を修正して再び診断を実施する、つまり診断と修正を繰り返すことができる
  • 診断結果を点数化して表示する。修正前後の点数の比較もできるので、利用者はどこをどう直せば文章力を向上できるのか、的確に把握できる
  • Web上のサービスなので、時間や場所を問わず、Webブラウザがあれば、どこでも利用できる
  • コンピュータによる診断なので、教師や上司などの人間による添削と比べた場合、教える側の癖が出にくい
といった特徴を備えています。

3.SAI の想定利用者と文章のタイプ

  ザ・ネットでは、「読みにくい文章を読める文章にする。そのために必要なポイントを利用者に伝え、理解させること」を主眼に置いて、SAI を開発しました。主な想定利用者は、文章を書き慣れていない方、書く機会は多いが何となく自信が持てない方、自分ではきちんと書いているつもりだが「意味が伝わらないことがある」と感じている方などです。具体的には、高校生や大学生、企業の新入社員、これまであまり文章を書く機会がなかった中堅社員、を想定しています。そうした方々が、報告書や提案書、論文など事実や自分の実績、意図を他の人に伝える文章を、きちんと書けるようになる--。これを支援するのがSAI の目的です。
  逆に、誰が見ても上手に文章を書ける方、あるいは小説家や脚本家の方などは、想定外です。そうした方は、意図的にキーワードを隠したり、副詞や接続詞を使い分けたり、レトリックを駆使したりした文章を書くことが多いので、SAI で診断すると採点が低くなってしまうケースがあるからです(ただし参考にしていただける要素はあります)。

4.SAI の採点基準

  SAIは利用者が入力した文章を100点満点で点数化します。そのロジックは、センテンス(一文)の長さ、漢字使用率、接続詞率、指示語率、副詞率など合計9項目それぞれに、10点~20点を配点。各項目の得点を合計するというものです。「接続詞率」を例にとると、入力した文章に含まれるセンテンス数と接続詞の比率を理想的な文章のそれと比較し、接続詞の数が多くなればなるほど減点します。このような採点を可能にするために、大量の新聞文章を基にした基礎データ作成を実施し、日本語文章の専門家によるチューニングを加えて、理想的な文章の基準値を算出しています。

5.文章解析エンジン「文道」とは?

  SAIは文章解析エンジンとして、シードウィンの「文道」を採用しています。以下で文道の概要と採用の理由を説明します。
  文道は、箇条書き文、小説、論文、日記、日報、マニュアル、企画書といった様々な文章を解析し、書き手の理解力や能力、性格や思考のタイプ、さらに適性など、様々な事柄を引き出すツールです。シードウィンは、文道を人材学、マーケティング論、組織論、心理学、教育学など、様々な分野の研究者に、ASPサービスとして提供しています。では文道は、どのような理論的・技術的背景を持っているのでしょうか。
  「人の性格や資質、特性は、その人が書いた文章に表れる。キーワードの出現頻度、文章の長さ、接続詞の位置や副詞の使用頻度、使用単語数などを分析すれば、何かが分かるのではないか」――営業担当者をはじめとする人材育成/社員教育コンサルティングに取り組んでいたシードウィンは1983年、本業の高度化に向けて、文章から人の特性や思考のタイプを分析する研究に着手しました。例えば、営業方針を通知したとき、営業担当者全員がどれだけ深く理解し、納得しているか。これを知るには通常、個別面談を行う必要がありますが、面談には膨大な時間がかかりますし、本音を聞けるとは限りません。シードウィンは各人の考えを書いた文章を分析すれば、理解度や納得度を抽出できると考えたのです。
  そのためには、文章表現から書き手の思いや理解度を導き出す技術、本音で書かれた文章とそうでない文章の差異を検出する技術など、様々な技術を開発する必要があります。書き手の主張の根幹を成すキーワード群と論旨を補足する単語群を分離し、それらの関係を統計処理したり、文章の特性をグループ化したりするような技術も必要です。
  文字通り、ゼロからの地道な研究開発でしたが、多様な辞書の開発・整備や単語を分離抽出する技術、言葉の曖昧さを処理する技術の研究開発を経て1989年、基本となるシステムを開発。様々な人が書いた様々な文章のデータベース化と書いた人自身のデータ収集を開始しました。これらを用いて文章解析技術の改良や精度向上、辞書の拡充を進め、文章から書いた人の特性を因子化することに成功。2002年、「文道」として、複数の研究者に提供を開始しました。
  以上からお分かりいただけるように、文道は構文解析や形態素解析、意味解析など日本語の解析は当然のこととして、文章から書き手の能力や性格、思考のタイプと関連づけるという、ほかにはない特徴、将来的なポテンシャルの高さを備えています。この点を評価し、ザ・ネットではSAIの文章解析エンジンに文道を採用しました。
  なお文道のその他の詳細に関しましては、http://www.seedwin.co.jpをご覧下さい。



 ※ サイト内の記載事項は予告なく変更することがあります