金明哲『テキストアナリティクスの基礎と実践』(岩波書店、2021)を読みました。
デジタル・ヒューマニティーズ系の論文を読んでいると、常識として使われるような専門用語がたくさんあります。非常識な私は、もちろんそれが分からないので、調べるのですが、なぜそれが必要なのかが分からないときがあります。
本書は、そうした専門用語、t値、p値、k-means法などなど、基本的なことについて、その仕組みや役割を簡潔に説明してくれます。私としては共起を求める仕組みが分かったことが面白かったです。コンピューターによるテキスト分析の一連の流れがなんとなく理解できたことも、ありがたかったです。
ただ、簡潔さゆえに私には30%くらいしか理解できませんでした。本書のせいではありません、私がおろかなのです。
まずは統計の基礎を学んでから、もう一度読み直します!