テスト論を学び直したいと思って本を探し始めると、すぐに教育評価、教育測定、心理測定、項目反応理論、作問実務が入り混じって見えてくる。そこでこの記事では、受け取った確定リストを土台に、学校教育のテストを芯にしながら、独学で筋が通る順に棚を組み直した。おすすめ本として手に取りやすい入門から、理論を深める本、実際に作る人のための本まで、流れで読めるように並べている。
- 読む目的別の入り方
- テスト論は、点数の話だけでは終わらない
- 迷ったらこの順で読む
- 見取り図をつかむ入門
- 教育測定・効果測定の基礎を固める本
- 心理測定・尺度構成からテストを理解する本
- 項目反応理論と現代テスト理論を学ぶ本
- 実際にテストを作る・運用する人向けの本
- 追補として加えたい3冊
- 関連グッズ・サービス
- まとめ
- FAQ
- 関連記事
読む目的別の入り方
- まず全体像をつかみたいなら、1 → 2 → 3 → 13 → 15 の順が入りやすい。
- 授業や学校現場に引き寄せて考えたいなら、1 → 3 → 4 → 8 が自然につながる。
- 測定理論まできちんと踏み込みたいなら、10 → 12 → 13 → 15 → 16 → 17 で読むと腰が据わる。
テスト論は、点数の話だけでは終わらない
「テスト論」で本を探すと、実際には「教育評価」「教育測定」「項目反応理論」「入試」「作問」まで検索の棚が広がっていく。とくに現在の議論では、テストを単なる序列づけではなく、学びをどう支えるかという問いで見直す本と、妥当性や公平性を測定論から考える本の二つが強く並びやすい。項目反応理論は、入試や大規模調査を考えるうえでも欠かせない基礎として扱われることが多い。
そのため、独学でいちばん大事なのは、最初から数式に飛び込まないことだ。先に「テストは何のためにあるのか」を考え、そのあとで「どう測るか」「どこまで公平にできるか」「作る側は何に気をつけるべきか」へ進むと、理論が生きた知識になる。この記事もその順番で並べてある。
迷ったらこの順で読む
このテーマは、最初の一冊を間違えると急に息苦しくなる。だから独自の型として、この記事では「読む順」を一本だけ通しておく。
最初の入口は 1『何のためのテスト?』でよい。そこでテスト観を揺さぶられたら、2『テストの科学』で設計と公平性の輪郭をつかむ。そのあと 10『テスト学入門』と 12『心理測定法への招待』で測定の発想に慣れ、13『テストは何を測るのか』から 15『IRT入門』へ進む。この流れなら、理念と技術がばらけず、頭の中で一本の線になる。
見取り図をつかむ入門
1. 何のためのテスト?――評価で変わる学校と学び
この本の良さは、テストをうまく作る技術の話から始めないところにある。そもそも、学校はなぜこれほどまでにテストに支配されているのか。点数をつけることは、本当に学びを支えているのか。そんな問いを正面から置き直してくる。
読みながら感じるのは、テストへの違和感が個人の気分ではなく、制度や文化の問題として整理されていく手応えだ。ふだん学校や研修で評価に関わっていて、どこか息苦しさを覚えている人ほど、この本で言葉を与えられるはずだ。点数があるから安心できる反面、その安心が学びを細くしているのではないかという感覚に、静かに輪郭が出る。
テスト論の入門書として見ると、かなり思想寄りである。だから即効性のある作問技術を先に知りたい人には遠回りに見えるかもしれない。だが、ここを飛ばすと、その後に読む測定論がただの手法の話になりやすい。何を守るためにテストを設計するのか、その根っこを先に確かめておく意味は大きい。
成績の付け方に迷っているときだけでなく、テストをめぐる空気そのものに疲れているときに刺さる本でもある。読後、テストを減らすか増やすかではなく、学びとの距離をどう取り直すかという視点が残る。最初の一冊に置く理由が、読み終えるころにはよくわかる。
2. テストの科学: 試験にかかわるすべての人に
タイトルのとおり、試験を感覚ではなく科学として捉えるための本だ。信頼性、公平性、採点、設計、結果の解釈といった論点が広く見渡せるので、テスト論の全体像を一段しっかりさせたい人に向いている。
この本がありがたいのは、専門用語を並べて威圧してこないことだ。試験を作る、受ける、運用する、そのどの立場から見ても「たしかにそこが問題になる」と思える論点が順に出てくる。学校の定期テストにも、資格試験にも、入試にも通じる骨格が見えてくるので、自分の現場が特殊だと思っていた人ほど視野が広がる。
読んでいると、良いテストとは難しいテストでも、平均点がきれいなテストでもなく、何をどう測り、その結果をどこまで信用できるかが説明できるテストなのだとわかってくる。作問や採点の場面で起きる小さな迷いが、実は大きな設計思想とつながっていたのだと気づく瞬間がある。
入門書としても優れているし、中級への橋渡しとしても優秀だ。1冊だけで全部わかった気にはならないが、次に何を学ぶべきかがはっきりする。独学で散らばりがちなテーマを、いったん机の上に広げて整理したい人にちょうどいい。
3. よくわかる教育評価[第3版]
テスト論そのものを一本で語る本ではない。けれど、だからこそ役に立つ。テストはあくまで評価の一部でしかないという当たり前のことを、この本はきちんと地図にしてくれる。
独学をしていると、つい「よいテストを作ること」が目的に見えてくる。だが、教育評価の全体の中に置き直してみると、観察、記述、パフォーマンス、ポートフォリオなど、学びを見取る方法はずっと豊かだ。その中で紙筆テストは何が得意で、何が不得意なのか。そこが落ち着いて見えてくる。
本書の強みは、全体像の整理にある。測定や統計に偏りすぎず、現場の評価実践にも寄りすぎず、ちょうど中間の高さから景色を見せてくれる。教育評価という大きな部屋の中で、テスト論がどの位置にあるのかを把握したい人にはありがたい一冊だ。
まだ何冊も読んでいない段階で手に取ると、少し教科書的に感じるかもしれない。けれど、1や2を読んだあとに戻ると、一気に効いてくる。頭の中で散らばっていた言葉がつながり、学び直しの土台が静かに固まる。
4. パフォーマンス評価―思考力・判断力・表現力を育む授業づくり
テスト論を学ぶときに、あえて紙筆テストの外へ出る。その意味を教えてくれる本だ。思考力、判断力、表現力のように、単純な正誤だけでは取りこぼしやすいものをどう評価するか。その問いが授業づくりと結びついて語られる。
この本を読むと、テストが悪いのではなく、テストだけで何でも見ようとする姿勢が窮屈なのだとわかる。学習者が何を考え、どう表現し、どこでつまずいているのか。そうした動きのある学びを見取るには、評価の形式そのものを変えなければならない場面がある。
授業実践に近い空気があるので、理論書ばかり読んで少し乾いてきた頭にも入りやすい。現場で子どもや学生の反応を見ている人ほど、「なるほど、ここは小テストだけではわからない」と思う場面が多いはずだ。評価は採点作業ではなく、授業の設計と表裏一体だという実感が残る。
テスト論の本棚に入れると少し横道に見えるかもしれない。だが、この横道があるから、紙筆テストの長所も短所も見えやすくなる。点数に閉じない評価観を持ちたい人には、早めに読んでおく価値がある。
教育測定・効果測定の基礎を固める本
5. 教育測定学(下巻)
読みやすさで言えば、最近の入門書にはかなわない。けれど、教育測定の骨格をきちんと押さえたいなら、この本の持つ重みはまだ強い。流行語ではなく、測るという営みの土台をじっくり積み上げる感触がある。
古典的な厚みのある本は、ときに読む体力を要する。そのぶん、ごまかしが利かない。信頼性や妥当性を、便利なキーワードとしてではなく、測定論の中でどう考えるべきかが見えてくる。少し読み進めただけでも、ふだん軽く使っていた言葉の輪郭が変わる。
独学でここまで来る人は、もう「なんとなくわかった」で済ませたくない段階だろう。テストの設計や解釈に関わる前提を、手応えのある言葉で持っておきたい。そういう人に、この本は静かに効く。すぐに使えるコツより、長く残る基礎をくれるタイプの本だ。
仕事終わりに一気読みする本ではない。机に置いて、何度も戻る本である。少しずつでも読み切れば、その後に触れる実務書やIRTの本の見え方が確実に変わる。
6. 教育測定の歴史: 「知を測る科学」の誕生と展開
測定理論を学んでいると、ときどき「そもそも、なぜこんなに測ろうとするのか」という疑問が顔を出す。その問いに歴史から答えてくれるのがこの本だ。テストの手法だけではなく、測る文化そのものの成り立ちに目を向けさせる。
教育測定は、中立で透明な技術のように見えやすい。だが歴史をたどると、そこには制度、政策、選抜、社会的な期待が複雑に絡んでいる。測ることは常に善であるとは限らず、同時に、測ることなしに支えられない場面もある。その揺れの中で理論が育ってきたことがよくわかる。
理論の本ばかり読んでいると、どうしても現在の枠組みが自然なものに見えてしまう。この本は、その自然さを少し崩してくれる。テストの歴史を知ることで、いま当たり前のように使っている尺度や選抜方法も、別の角度から見えるようになる。
測定論に少し入り始めた人が読むと、視界が奥へ開く。いまの制度に賛成でも反対でもよい。ただ、歴史を知ると議論が浅くならない。腰を据えて学びたい人にふさわしい一冊だ。
7. 教育測定の社会史: 田中寛一を中心に
海外の理論書を読んでいると、日本の教育測定は輸入された枠組みとしてしか見えなくなることがある。この本は、その感覚を修正してくれる。日本で教育測定がどのように受け入れられ、どんな人物や制度を通して根づいていったのかが見えてくる。
社会史として読むと、テストは単なる学問的技術ではなく、社会の中で使われる実践なのだとよくわかる。制度がどう作られ、誰が推進し、何が期待され、何が取りこぼされたのか。その流れの中で測定を捉え直すと、理論の本で見ていた言葉が急に具体性を帯びる。
とくに、日本の教育史や教育行政に関心のある人には相性がいい。海外の標準理論だけでは説明しきれない、日本の学校文化の癖や制度の文脈が立ち上がってくるからだ。測定が「日本ではどう生きたのか」を知りたい人には貴重である。
少し渋い本ではあるが、こういう本を一冊混ぜると棚全体が引き締まる。テスト論をただの技術としてではなく、社会と教育の関係として読みたい人にすすめたい。
8. はじめての教育効果測定: 教育研修の質を高めるために
学校教育のテスト論から少し外れ、教育や研修の成果をどう確かめるかに焦点を当てた本だ。だが、その少し外れた場所に、かえって大事な感覚がある。テストを実施して終わりにしないための視点が手に入る。
教育や研修の場では、「やった感」は生まれやすい。けれど、それが本当に学習の変化につながったのか、行動が変わったのか、現場に戻ったあとに何が残ったのかは曖昧なままになりやすい。本書は、その曖昧さをできるだけ言葉と手順に落としていく。
ここで学べるのは、数字を増やすための測定ではない。改善のために測るという発想だ。テストの点だけを成果と見なすのではなく、教育活動全体を振り返る材料としてデータをどう使うか。その意味で、学校の授業改善にも十分応用が利く。
研修担当者や授業改善に関わる人には特に役立つが、もっと広く、評価結果を次の行動につなげたい人すべてに向いている。測ることと育てることの距離を縮めたいときに読みたい本だ。
9. 教育研修効果測定ハンドブック
入門を読んだあとに、手元に置いておきたくなるのがこういうハンドブックだ。理論を一通り学んでも、実際に設計しようとすると手が止まる。その止まりやすい場所で頼れる。
本書の価値は、評価や測定を実務の流れに落とし込む参照性の高さにある。何を目的にし、どの段階で何を見て、どう解釈するのか。大げさな理念ではなく、現場で回すための筋道が見つけやすい。現場はいつも時間が足りない。その不足の中で最低限は外さないための補助線になる。
学校よりも企業研修寄りに感じる箇所はあるが、そこで出てくる発想はかなり汎用的だ。教育活動の成果を検討するとき、何を成果とみなすのか、その前提がぶれないだけでも大きい。実務の本はすぐ古くなることもあるが、ここで学ぶ問いの立て方は長く残る。
机の上でじっくり読むというより、必要なときに開く本である。独学の中盤でこういう本を一冊持っておくと、理論と実践の往復がぐっとやりやすくなる。
心理測定・尺度構成からテストを理解する本
10. 心理・教育・人事のためのテスト学入門
この本の強みは、教育に閉じこもらないことだ。心理、教育、人事という異なる場面をまたぎながら、テストとは何かを横断的に考えさせてくれる。だから、学校の文脈だけで理解が固まりすぎるのを防いでくれる。
テストは、どの世界でも似たような問題を抱えている。何を測っているのか、結果をどこまで信じてよいのか、使い方によって不利益が生じないか。そうした問いを領域横断で見ると、教育のテストだけが特殊なのではなく、測定一般に通じる難しさが見えてくる。
妥当性や信頼性の話も、専門書ほど硬すぎず、しかし軽すぎないバランスで入ってくる。独学でこの辺りに入ると、言葉だけ覚えて実感が伴わないことが多い。その点、この本は「使う側」の感覚を失わない。試験を設計する人、受検結果を読む人、採用や評価に関わる人など、どの立場にも橋が架かっている。
テスト論の中盤に置くと、とても効く。教育評価の話から一歩外へ出て、測るという営みの広さを見たい人にすすめたい。視野が広がると、学校のテストも少し違って見えてくる。
11. 心理尺度構成の方法:基礎から実践まで
既存のテストを読むだけでは物足りず、自分でも尺度や問題を作る側に回りたいなら、この本はかなり頼りになる。尺度構成の発想を、概念の整理から実践へつなげて考えられるからだ。
良い問題や良い尺度は、思いつきではできない。何を測るのかを定義し、項目を作り、吟味し、データを見て、また戻る。その往復が必要になる。本書はその流れをちゃんと見せてくれるので、評価や質問紙を作る作業が、職人技ではなく設計として見えてくる。
教育のテスト論から見ると少し心理統計寄りだが、だからこそ学べることが多い。問題の良し悪しを感覚で語るのではなく、測りたいものとの整合で考える癖がつく。これは小テストの作問でも、研修アンケートでも、かなり役に立つ感覚だ。
自分で作る必要が出てきたとき、人はようやく理論のありがたみを知る。その入り口にいる人に、この本はよく効く。作問や尺度づくりを少し真面目に始めたいときの一冊である。
12. 心理測定法への招待: 測定からみた心理学入門
「測るとは何か」を、数式の前で立ち止まりながら考えられる本だ。心理測定の入門ではあるが、テスト論の周辺を学んでいる人にも非常に使いやすい。測定という行為が、思っているよりずっと繊細であることがわかる。
人はつい、点数が出れば何かを測れた気になる。けれど、点数はいつも現実の一部しか切り取らない。本書はその当たり前を、入門書らしいやさしさで思い出させてくれる。しかも、やさしいだけで終わらず、測定の考え方をちゃんと残してくれるのがよい。
理論を学ぶ前の助走として読むのにも向いているし、理論に少し疲れたときの整理にも向いている。抽象的な議論が、読んでいるうちにじわじわと身の回りのテストや尺度の話に結びついてくる。そういう静かな良さがある。
数字や統計に強くなくても読めるが、読後には測定を雑に扱えなくなる。その慎重さこそ、このテーマでは大きな財産になる。
項目反応理論と現代テスト理論を学ぶ本
13. テストは何を測るのか
テスト理論の本の中でも、題名の問いがまっすぐでいい。テストは何を測っていて、何を測れていないのか。その単純で重い問いに、逃げずに向き合う本である。
この本の魅力は、理論書でありながら、読者を置いていかないことだ。項目反応理論の話に近づきつつも、まずは概念理解を丁寧に作ってくれる。受験や入試のニュースに触れるたびに、なんとなく公平性や難易度の話が気になっていた人には、とてもよい入口になる。
テストの点数はわかりやすい。だからこそ、そのわかりやすさが何を隠しているのかを考える必要がある。本書を読むと、良い問題とは何か、能力とは何か、比較可能であるとはどういうことか、といった問いが静かに広がる。制度の議論にもつながるし、現場の作問にも返ってくる。
独学の流れで言えば、ここがひとつの山場になる。ここを読めると、その先のIRT入門が急に現実味を帯びてくる。理論に入る直前の一冊として、とても座りがいい。
14. テストは何のためにあるのか―項目反応理論から入試制度を考える
項目反応理論を学ぶ意味が、制度の話まで届いてくる本だ。理論を知るだけで終わらず、入試や選抜のあり方をどう考えるかまで視野に入るので、読後の奥行きがある。
入試制度の話になると、人はすぐに賛成か反対かで語りたくなる。けれど、その前に必要なのは、何を測ろうとしていて、どこで公平性が揺らぎ、どんな設計なら何が可能になるのかを知ることだ。本書はそこを、項目反応理論という足場から考えさせてくれる。
理論を現実社会につなげたい人にはかなり相性がいい。教室の小テストだけでなく、大規模試験や入試改革に関心がある人が読むと、ニュースの見え方も変わるはずだ。制度は理念だけでは作れないし、技術だけでも作れない。その間にある緊張がよく見える。
数字に強い人より、むしろ制度や教育の公正さに関心がある人にすすめたい本でもある。項目反応理論が、ただの難しい手法ではなく、社会的な問いに触れる道具であることがわかる。
15. 「新テスト」の学力測定方法を知るIRT入門: 基礎知識からテスト開発・分析までの話
IRTをこれから学ぶ人の入口として、かなり使いやすい本だ。やさしく書かれているが、薄くはない。基礎知識だけでなく、テスト開発や分析まで見通せるので、理論が実務にどう降りてくるのかが見えやすい。
IRTという言葉は知っていても、実際には難しそうで手を出せない人は多い。この本はその壁を少し下げてくれる。困難度、識別力、当て推量といった言葉が、ただの専門用語ではなく、良質なテストをどう作るかの感覚につながっていく。公平なテストづくりやCBTとの相性の話まで含めて、今の試験環境に接続しやすい。
入門書として優れているのは、数式に飲み込まれにくいからでもある。もちろん理論の骨格は必要だが、それを読者の理解の速度に合わせて差し出してくれる。独学者にとって、この配慮はかなり大きい。
理論を学びたいが、完全に研究書に入る前に一冊挟みたい。その気分のときにちょうどいい。この記事全体の中でも、もっとも「次に進みやすい」本の一つである。
16. 項目反応理論(シリーズ〈行動計量の科学〉)
入門を越えて、IRTの全体像をきちんと学びたくなったら、この本が視野に入る。少し専門寄りだが、そのぶん理論の見通しがよい。独学でも読めないことはないが、測定や統計の基礎があると、より楽に入れる。
本書の良さは、項目反応理論を部分的な便利技としてではなく、体系として見せてくれるところにある。理論の構造が見えると、ほかの本で出会った個別の話題もつながりやすい。断片が線になる感覚がある。
ここまで来る人は、もう「なんとなくIRTが大事らしい」では足りなくなっているはずだ。どういう前提でモデルが成り立ち、どこで強みがあり、どこに注意が要るのか。そこを自分の言葉で言えるようになりたいなら、この本は頼れる。
少し背伸びして読む本だが、背伸びする価値がある。専門に進むかどうかは別として、テスト論を一段深く理解したい人にとって、ここはよい踏み石になる。
17. 項目反応理論(理論編)
より理論寄りに、数理的な基礎まで押さえたい人のための本である。実務のヒントをすぐ取りたい人には重く感じるかもしれないが、理論の芯まで見たいなら避けて通れないタイプの一冊だ。
テスト理論は、実務に役立つからこそ広く読まれる。だが、広く使われるものほど、その前提を深く理解している人は少なくなる。本書は、まさにその前提へ戻っていく。モデルの意味を、使い方のレベルで止めずに考えたい人には重要だ。
読んでいてすらすら進む本ではない。何度も止まり、戻り、他の本と行き来することになるはずだ。でも、その時間は無駄にならない。ここで見えてくる理論の厳密さは、軽い議論を避けるための支えになる。
研究寄りの関心がある人、あるいは試験制度や尺度開発に深く関わる人に向く。独学の終盤に置くのが自然だが、ここまで来ると景色はかなり変わる。
18. テスティングの基礎理論
個別の作問テクニックではなく、テスティングの原理を広く捉えたい人に向く本だ。言語テスト寄りの文脈でも読まれるが、テストという営みの理論的土台を考えるうえで、かなり参照価値が高い。
理論の本というと、どこか抽象のまま漂ってしまうことがある。しかしこの本は、抽象で終わらず、テストを設計し、運用し、結果を扱うという流れにどう関わるかが見えやすい。良いテストとは何かを考えるための座標が増えていく感覚がある。
とくに、言語教育や資格試験、到達度評価など、現場でテストを使う領域にいる人が読むと効きやすい。理論が現場の遠くにあるものではなく、すぐ足元の判断につながっているのだとわかるからだ。
すでに何冊か読んだあとに手に取ると、頭の中の棚が整う。バラバラだった論点を一度体系として見直したいときにすすめたい。
実際にテストを作る・運用する人向けの本
19. 言語テストの基礎知識: 正しい問題作成・評価のために
言語テストの本ではあるが、問題作成と評価の基本をかなり実務的に学べる。専門領域が英語や日本語に限られていても、ここで扱われる勘所は一般的なテスト作成に十分応用できる。
良い問題とは何か。悪い問題はなぜ悪いのか。受け手の理解をどう歪めずに測るのか。こうした問いは、言語テストの現場でこそ鋭く問われやすい。本書はその現場感覚を持っているので、抽象的な理論を少し手触りのある形に戻してくれる。
小テストや到達度評価を作る人にとっても、かなり使える。問題文の曖昧さ、採点のぶれ、測りたい力とのずれなど、現場で起きがちな失敗に思い当たる箇所が多いはずだ。実務本としての素直な強さがある。
理論書を読んだあとに、「で、実際にはどう作るのか」と思ったタイミングで開くとちょうどいい。学びを手に戻す一冊である。
20. 日本語教師のためのテスト作成マニュアル
タイトルどおり、日本語教育の現場にかなり寄った本だ。けれど、作問実務に関わる人なら、専門外でも得るものが多い。具体的に良い問題をどう作るか、評価をどう安定させるかが見えやすいからだ。
抽象論だけを読んでいると、つい「理論はわかるが作れない」状態になる。本書は、そのもどかしさにかなり効く。出題意図と問題形式の関係、採点のぶれを減らす工夫、受検者にとって不必要なノイズをどう避けるか。そうした実務の気配が濃い。
学校でテストを作る先生、研修の確認問題を作る担当者、資格試験の初歩設計に関わる人など、実際に手を動かす人に向く。気分としては、理論書を閉じて鉛筆を持つ瞬間に近い。
理論を学んだあとに読むと、頭の中の知識が現場の判断へ変わっていく。すぐ役立つだけでなく、作問への姿勢そのものが丁寧になる本だ。
追補として加えたい3冊
ここまでの20冊で、入門から教育測定、心理測定、項目反応理論、作問実務までかなり筋の通った棚になる。ここからさらに現場感覚を強めたい人向けに、追補として3冊を置いておく。日本語教育の文脈が中心だが、評価法やテスト運用を身体感覚で学ぶにはむしろ読みやすい。
21. 日本語教育 よくわかる評価法
評価法の入門としてわかりやすく、テストと評価の関係を現場感覚でつかみやすい。とくに、評価を点数付けだけで終わらせたくない人には相性がいい。授業の中で何を見取り、どう返すかという目線が育つ。
テスト論を学んできたあとに読むと、理論が授業の呼吸に戻ってくる。少し肩の力を抜いて、しかし大事なことは外さずに読みたい本である。
22. 日本語テストハンドブック
辞書のように手元に置いておける一冊だ。テスト設計や見直しの場面で、どこを確認すべきかを俯瞰しやすい。理論を一通り読んだあと、実務で迷ったときの戻り先として便利である。
通読してもよいが、必要な箇所を開きながら使うほうがこの本らしい。現場で長く付き合えるタイプの本だ。
23. 英語テスト作成の達人マニュアル
英語教育寄りの本だが、出題意図と評価の整合を考えるうえで実践的である。良い問題を作るために、何を削り、何を残すか。その判断の仕方が見えやすい。
抽象理論では物足りず、具体的な作問の勘所を増やしたい人に向く。自分でテストを作る時間が増えてきた人ほど、こうしたマニュアル本の価値がわかるはずだ。
関連グッズ・サービス
本を読んだ後の学びを生活に根づかせるには、生活に取り入れやすいツールやサービスを組み合わせると効果が高まる。
理論書は机に向かって読む時間がどうしても要る。まとまった時間が取りにくい人は、通勤や家事の前後に少しずつ電子書籍で読み進められる環境があると続きやすい。
測定論や評価論は、一度読んだだけでは定着しにくい。耳から反復できる本や関連講義に触れられる環境があると、難しい概念も少しずつ体に入ってくる。
書き込みが多くなる分野なので、付箋と細めのペンも相性がいい。信頼性、妥当性、公平性のように似て見えて違う概念は、章ごとに色を分けて残しておくと読み返しやすい。読みっぱなしにしないだけで、理解の深さはかなり変わる。
まとめ
テスト論の本棚は、思っている以上に広い。入口では「何のためにテストをするのか」という問いがあり、中盤には教育評価と教育測定の整理があり、その先に心理測定や項目反応理論が控えている。さらに奥へ行くと、制度の公平性や実際の作問実務までつながっていく。
どこから入るかで、見える景色はかなり変わる。
- 全体像をつかみたいなら、1・2・3 を先に読む。
- 理論を深めたいなら、10・12・13・15 から 16・17 へ進む。
- 授業や実務に戻したいなら、4・19・20 を早めに混ぜる。
テストは、人を測る道具である前に、学びを見るための約束でもある。その約束を少しでも誠実なものにしたいなら、この分野の本はちゃんと応えてくれる。
FAQ
テスト論の最初の一冊はどれがよいか
迷ったら『何のためのテスト?――評価で変わる学校と学び』から入るのがよい。テストの技術ではなく、そもそも何のために評価するのかという視点が手に入るからだ。そのあとに『テストの科学』を読むと、理念だけでなく設計や公平性の話がつながってくる。最初から数理に入るより、ずっと息が続きやすい。
数学や統計が苦手でも項目反応理論まで読めるか
読める。いきなり専門書に入ると苦しくなるが、『テストは何を測るのか』や『「新テスト」の学力測定方法を知るIRT入門』のような橋渡しの本を挟めば、概念から理解しやすい。大事なのは、先に「なぜその理論が必要なのか」をつかむことだ。意味が見えれば、少し難しい話にも踏み込める。
学校の先生ではないが、この分野の本は役立つか
かなり役立つ。教育研修、人材育成、資格試験、社内テスト、アンケート設計など、「何かを測って判断する」場面は思っているより多い。とくに『心理・教育・人事のためのテスト学入門』や効果測定の本は、学校外の人にも入りやすい。測ることの怖さと必要性の両方を知っておくと、実務の判断が丁寧になる。
作問にすぐ役立つ本はどれか
理論を最小限押さえたうえで実務に寄りたいなら、『言語テストの基礎知識』『日本語教師のためのテスト作成マニュアル』『英語テスト作成の達人マニュアル』が使いやすい。専門領域は言語教育だが、良い問題を作るための発想はかなり汎用的だ。問題文の曖昧さや採点のぶれを減らしたいときに効く。


![よくわかる教育評価[第3版] (やわらかアカデミズム・〈わかる〉シリーズ) よくわかる教育評価[第3版] (やわらかアカデミズム・〈わかる〉シリーズ)](https://m.media-amazon.com/images/I/41xq1T2HqgL._SL500_.jpg)



















