Prometric Main Image
プロメトリックが提供するCBTサービスの仕組みについてご紹介いたします。

コラム:CBTの仕組み

第六回:試験結果の考え方@

2014年5月29日 掲載

このシリーズではこれまでに、CBT(Computer-based Testing、コンピュータを利用した試験)サービスにおいて「柔軟な受験機会を提供しつつ、試験としての公平性を担保する」という観点から、出題の仕組み、試験監督のあり方、そしてCBTサービスが近年注目されている社会背景についての話題を紹介しました。シリーズ第六回目となる今回は、試験結果の考え方(*)を紹介します。(*)厳密な理論の解説ではありません。

試験とは「能力測定のツール」である

人の身長や体重を測定するには測定対象に適した測定器 (体重計など)が必要です。人の能力を測定する場合も同様で、それが試験です。つまり試験は「人の能力を測定するためのツール(道具)」なのです。試験を測定ツールと呼ぶからには、その測定機能の背景には論理的に確立された仕組みが存在し、測定結果を生み出しているはずです。能力は身長や体重と異なり潜在的な特性ですので、その測定には身長・体重を測定した結果の解釈とは異なる考え方が必要になります。

代表的な2つの枠組み

試験により能力を測定した結果の考え方の背景には、大きく2つの理論的枠組みがあり、それぞれ「古典的テスト理論」および「現代テスト理論」と呼ばれます。その名のとおり前者は古くからある考え方で、今でも日本では前者のほうが広く採用されています。後者は比較的新しい考え方で、「項目反応理論」あるいは英語のItem Response Theoryの頭文字をとって「IRT」とも呼ばれます。

古典的テスト理論

単純な例として、1問1点で100問100点満点の試験を想像してみてください。古典テスト理論の枠組みでは、試験を特定の問題の塊と捉え、その特定の問題の塊に対し得点が高いほうが能力は高いと考えます。つまり「能力が高い <=> より多くの問題に正答する(得点が高い)」となるため、70点を取った人と71点を取った人の能力を比較すると、たとえ1点の差であっても後者のほうが能力が高いという判断になります。

この考え方にはいくつかの注意点がありますが、ここでは一点だけ、「同じ問題でないと得点(能力)が比較できない」という制限があることを挙げておきます。得点が能力水準に直接対応していると考えるのですから、測定結果は出題された問題自体に依存するのが当然です。極端な話、難易度の低い問題ばかりが出題された試験からの得点と、難易度の高い問題ばかりが出題された試験からの得点は、単純に比較できるわけがないのです。大学入試で浪人生が試験(特に大学入試センターの試験)の後に「去年のほうが得点は高いから、去年の得点を使ってください」と申し出ても認められないのには理由があるのです。

しかし最近になって大学入試改革が検討されるようになり、その過程で、試験の結果の年度を越えた利用についても検討が進められています。これは試験技術の観点からは、非常に大きな変化です。日本では、大学入試に限らず、多くの国家資格試験が試験終了後に全ての問題を公開することを原則としています。一回出題された問題は過去問集として将来の受験者に提供されるため、同じ問題を再度出題することはできません。近い将来、日本の大学入試において異なった時期の試験の結果を比較する必要が出てくるかも知れませんが、その時に「同じ問題でないと得点(能力)が比較できない」という制限が障害となってきます。そこで注目されるのが、現代テスト理論です。

現代テスト理論(項目反応理論、IRT)

項目反応理論の"項目"とは個々の問題のことです。古典的テスト理論では試験を特定の問題の塊と捉えますが、現代テスト理論では、問題は個別に扱われます。古典的テスト理論での測定結果が得点(問題全体の中で正答した問題の割合)であるのに対し、現代テスト理論では「このような問題をこれだけ出題したら、このように正答した」というデータから、特殊な数理モデルに基づいて確率計算を行い、試験結果として能力値となるものを算出します。

先ほど古典的テスト理論に関連して挙げた注意点は、現代テスト理論の場合はどうなるのでしょう。現代テスト理論による測定結果は得点自体ではなく、どんな問題が出題されたのかが考慮されています。つまり、能力値の計算過程では問題が異なっていることは織り込み済みなので、同じ問題でなくても測定結果が比較できるのです。

試験の状況・目的に応じて、適切な理論の枠組みを選択する

「古典」対「現在」と言ってしまうと、暗黙のうちに現代のほうが優れているように聞こえるかもしれません。しかし試験の現場においては、現代テスト理論の枠組のほうが常に望ましいとは限りません。それぞれの試験制度の状況に応じて、より適切な考え方を意識して選択することが大事なのです。次回は、古典的テスト理論の枠組みについて、もう少しキーワードを紹介します。

CBTの仕組み:第六回 試験結果の考え方@
CBTの仕組み:第五回 CBTとグローバル化が進む社会
CBTの仕組み:第四回 試験監督のあり方
CBTの仕組み:第三回 試験問題の事前評価
CBTの仕組み:第二回 出題の仕組みA LOFT方式
CBTの仕組み:第一回 出題の仕組み@ フォーム方式

<<コラムトップへ戻る

プロメトリックの「試験作成ソリューション」に関する詳細をご希望の方は、お気軽にお問い合わせください。