AIの要約って、短くしたのに大事な感じが消えるのはなぜ?

AIの要約って、短くしたのに大事な感じが消えるのはなぜ?
目次

短いのに、ほしかった感じがない

AIに長い文章を要約してもらうと、短くはなったのに「そこじゃないんだよな」と感じることないですか?

会議メモを3行にしてもらうと、決定事項は残っている。 でも、誰がどこで迷っていたのか、どの発言で空気が変わったのか、そういう温度が消えている。

記事の要約でも同じことがあります。 主張は合っているのに、筆者が慎重に置いた但し書きが抜けて、少し強い断定に見えてしまう。

文字数は減った。 情報も残っている。 それでも、読み手がほしかった感じだけが落ちている。

削ったから消えた、だけでは足りない

要約は長い文章を短くする作業なわけですが、でも、ここで一つ不思議があります。

短くするだけなら、大事な文を順に残せばよさそうです。 ところが実際の要約では、文そのものを残すか消すかだけでなく、文章のどの性質を中心に残すかが変わります。

たとえば、会議メモにはいくつもの性質があります。 結論の強さ、反対意見の有無、迷いの大きさ、期限の近さ、相手の切迫感、仮置きの数字か確定値か。

要約は、こうした性質を全部そのまま持っていけません。 少ない場所に押し込むので、何かは太く残り、何かは細くなります。

そのとき落ちるのは、必ずしも「どうでもいい情報」ではありません。 平均的には小さな差でも、その場の判断には効く差があります。

少ない軸に押し込むと何が落ちるか

この現象を、主成分分析という見方で解釈できるかやってみます。 主成分分析は、たくさんの特徴を、少ない軸で見直す方法です。

ここで言う軸は、ものさしのようなものだと思ってください。 文章を「結論の強さ」という軸で見ることもできるし、「迷いの大きさ」という軸で見ることもできます。

主成分分析では、全体としてよく動いている向きを優先して軸にします。 たくさんの文章を見たとき、差が大きく出る方向を先に残す、という考え方です。

実際のAI要約がそのまま主成分分析で動いている、という話ではありません。 ここでは、要約で何が残り、何が落ちるのかを見るための小さな模型として使います。

この模型で見ると、「大きく変わる特徴」は残りやすい。 一方で、「小さいけれど意味のある特徴」は落ちやすい。 このズレが、短いのに大事な感じが消える理由として読めます。

大きいばらつきと、大事な差は別もの

同じことは、仕事の文章でよく起きます。

お客さんからの長いメールをAIに要約してもらうと、「問い合わせ内容」と「希望納期」はきれいに残る。 でも、文面全体にある焦りや不満の気配が薄まることがあります。

資料の要約でも、結論と数字は残る。 けれど、「この数字はまだ仮置きです」という慎重さが落ちると、読み手には完成した話のように見えてしまいます。

このとき、AIが雑に要約したと決めつけるより、「どの軸に押し込まれたのか」と見るほうが、次の手が打ちやすい。

結論の軸ではうまく圧縮できている。 でも、迷い、温度感、仮置き感の軸は弱くなっている。 そう見れば、要約の直し方がかなり具体的になります。

式にして見てみる

文章の特徴をベクトル $x$ と置いてみます。

$x$ は、元の文章が持っている特徴のまとまりです。 たとえば、結論の強さ、感情の強さ、但し書きの多さ、期限の近さが並んでいると思ってください。

平均的な文章の特徴を $\bar{x}$ とします。 すると $x – \bar{x}$ は、「この文章が平均からどちらにどれだけズレているか」を表します。

そのズレを、一本の軸 $w$ に押し込めた値を $z$ とします。 式にすると、こう読めます。

$$ z = w^\top (x – \bar{x}) $$

$z$ は、圧縮された後の値です。 $w$ は、どの向きから文章を見るかを決める軸です。 $w^\top (x – \bar{x})$ は、その軸に向かって元の特徴を投影する、という意味です。

主成分分析では、$w$ を適当に選びません。 長さを $\|w\| = 1$ にそろえたうえで、$z$ のばらつきが大きくなるような $w$ を探します。

もう少しだけ式で書くと、共分散行列を $S$ として、次の量を大きくする軸を探します。

$$ \mathrm{Var}(z) = w^\top S w $$

$S$ は、特徴どうしがどのくらい一緒に動くかをまとめた表です。 $w^\top S w$ は、その軸で見たときに、文章どうしの違いがどのくらい大きく出るかを表します。

この式で見ると、残りやすいのは「読み手にとって大事なもの」そのものではありません。 残りやすいのは、「データ全体でよく動く向き」です。

だから、但し書きや温度感のような小さな差は、短い要約の中で押し負けることがあります。 それが重要でないからではなく、選ばれた軸では目立ちにくいからです。

文章の特徴を点で表し、ばらつきが大きい向きへ押し込む主成分軸の例
文章の特徴を点で表し、ばらつきが大きい向きへ押し込む主成分軸の例

図では、文章の特徴を点として置き、点群がいちばん伸びている向きに軸を引いています。 この軸が、主成分分析で最初に残したくなる向きです。 点をその軸へ押し込むと、大きな流れは残ります。 一方で、軸から少し外れた方向にある差は薄くなります。 要約で「主張は残ったのに温度感が消えた」と感じるとき、その温度感はこの外れた方向にあったのかもしれません。

頼み方は、軸の指定になる

要約を直したいとき、「もっとちゃんと要約して」と言っても、何を残せばいいのかはまだ曖昧です。

でも、「決定事項だけでなく、迷っていた点も残して」と言うと、迷いの軸を足せます。 「断定を強めすぎないで」と言えば、但し書きの軸を残せます。 「相手の温度感も残して」と言えば、感情の軸を残せます。

3行にするか、5行にするかだけが要約の指定ではありません。 どの軸を残すかも指定できます。

AIの要約がズレたとき、文章量だけを責めると調整しにくい。 「どの軸に圧縮されたのか」と見ると、次に足すべき一言が見えてきます。

要約を短くする指示ではなく、残したい軸を指定する。 それだけで、「短いけど違う」を「短いのに使える」に寄せられるかもしれません。

よかったらシェアしてね!
  • URLをコピーしました!
目次