活字耽溺者の書評集

好きな本を自由気ままに書評するブログ。

『ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム』 ジョディ・アーチャー、マシュー・ジョッカーズ/西内啓監修/川添節子訳/日経BP社

※この記事はHONZからの転載です。

コンピューターによる文芸批評の時代

 売れる小説を書きたい――作家を志す人ならば、一度は妄想する夢だろう。印税収入だけで暮らしていけたら、人生どんなに楽なことか。しかし、当然のごとく世の中は残酷で、運よくデビューできても、ロクにヒットも出せぬまま消えていくケースなどいくらでも存在する。ましてや今や出版不況、売れない文芸作家に対する風当たりは一段と厳しい。

 そうした非情な現実の嵐に懊悩するあなたの耳元で、本書はささやく。実はベストセラー作品には、黄金の法則があるのですよ。しかもこれは評論家や批評家の主観的評価ではなく、最新のコンピューター・プログラムが弾き出した客観的データの集成であり、このアルゴリズムを通せばなんと80%の確率で売れるか否か判別可能なのです。それをあなたに特別にお教えしましょう、と。

 ……少々胡散くさい書き方をしてしまったが、本書『ベストセラーコード』は、タイトルに偽りなく、ベストセラーとなった小説から「売れる法則」をコンピューターで解き明かした一冊だ。

 それでもなんだか眉唾だ、と思う向きがいるかもしれないので、フォローすると、著者は二人ともアメリカのバリバリの文学研究者で(ジョディ・アーチャーは元文芸研究員のフリージャーナリスト、マシュー・ショッカーズは計量文献学とテキスト・マイニングの第一人者)、この本を記す前提として、個人的な意見を一切差し挟まないことを保証している。つまり徹底して真面目な研究書なのである。

 具体的なコードの内容に入る前に、彼らがどのような分析をしたか簡単に説明をしよう。

 まず、ニューヨーク・タイムズ紙のベストセラーリストから、ヒットした小説を500冊チョイスし、売れ行きが芳しくない小説4500冊と合わせて分析し、テキストの特徴を発見し抽出する。観点は、Iやhimといった単語が使われる頻度や、単語の持つ意味(ポジティブかネガティブか)の振り分け、扱われるトピックの分類など。

 この「テキスト・マイニング」と続けて行われたのが「機械学習」だ。これはテキスト・マイニングによって得た特徴を入力して、ベストセラーになるかどうかを予測するプロセスである。これらの解析の中にはコンピューターへ強い負荷が掛かるものもあり、著者らは1000台のコンピューターを用意し一度に1000冊処理する体制を整えたが、それでも4年の歳月を要したそうだ。

 では、この惜しみない労力の結果を見ていこう。

 はじめは、文章中に含まれるトピック。アメリカでヒットした小説は、「弁護士と法律」「家庭の時間」「愛」「チームスポーツ」といった、日常生活に即したトピックを盛り込んでいる。興味深いのは、ベストセラー作家は、トピックを3つか4つ程度しか入れないのに対し、売れない作家は情報をやたらと詰め込む傾向があることだ。要するに、話があっちこっち飛ぶ作品はウケが悪い。

 また、この条件をクリアしている例として挙げられているのが、『フィフティ・シェイズ・オブ・グレイ』だ。「ひどいポルノ小説だ」として作家や評論家からこき下ろされた作品だが、実は大衆の心を巧みにつかむ三幕構成となっており、登場人物(と読者)感情の浮沈をグラフ化すると、あの『ダヴィンチ・コード』とほぼ一緒の波形を描くというのだから驚きである。ベストセラーは物語の基本をしっかり踏襲しているというわけだ。加えて著者らは、売れる作品のプロットラインは全部で7つあるとしている。

 分析はさらに微に入り細をうがっていく。たとえば、ベストセラーは、冒頭の一文から惹き込んでくる。本文中で例示されているスティーヴン・キング『シャイニング』(深町眞理子訳、文藝春秋)を引用してみる。

 Jack Torrance thought: Officious little prick.

(鼻持ちならん気取り屋のげす野郎め、というのがジャック・トランスのまず感じたことだった。)

 たった6語で、二人の人間の対立をリズミカルに示唆している。なにより、人物の声がすっと入ってくる。売れる小説は、全般的に、余計な言葉を挟まず、I’dやyou’reといった縮約形も駆使して、短く簡潔に書かれている。これは、私も訓練しているが、小説のみならず、人に読ませる文章を書くうえで欠かせない技術である。

「読ませる」観点でいくと、魅力的なキャラクター造形も不可欠だ。ベストセラーの主人公は、必ず何かを必要とし(need)、何かを求めている(want)。売れない小説は、この二単語の使用頻度が低く、消極的なフレーズが多い。

 さらに対照的なのが、売れる小説の主人公は、主体性の高い言葉との結びつきが強く、行動的であることだ。実行する(do)、考える(think)、達成する(reach)といった動詞が典型的だ。このデータは、『ミレニアム』シリーズや『ゴーン・ガール』、『ガール・オン・ザ・トレイン』などのダークヒロイン小説ブームを下支えする要素だと著者らは指摘する。

 さて、ざっくりとデータを見てきたが、それなりに小説を読んできた人からすれば、どれも感覚として理解している話かもしれない。だが、最初にも述べたけれど、小説の評価を定量的かつ客観的な証拠として示せたのは大きいし、ひじょうに興味深い。

 ただし、言わずもがな、これはアメリカの文芸出版市場が舞台である。日本にそっくりそのまま転用とはいかないし、時が経てば読者の好みも価値観も変わる。しかし、本書を監修している統計家の西内啓氏によれば、著者らの行った解析を日本市場でもビジネスとしてできるそうで、出版関係者でお悩みの方はご相談ください、とのこと。

 それにしても、コンピューターが人間の創造性までソートできるようになった事実には唸らざるを得ない。AIが小説を書いたというニュースも記憶に新しいし、揉み手をしつつAI先生とアルゴリズム先生のご機嫌うかがいをする時代は近そうだ。(2319字)