第八章
心理與教育測驗(yàn)的編制與實(shí)施>>練習(xí)與思考
練習(xí)與思考:
1.結(jié)合實(shí)例簡述編制一個心理測驗(yàn)的基本程序。
2.闡述實(shí)施心理測驗(yàn)應(yīng)注意的問題。
3.如何正確解釋測驗(yàn)分?jǐn)?shù)的意義。
4.論述向當(dāng)事人報(bào)告測驗(yàn)分?jǐn)?shù)的基本原則。
解答要點(diǎn):
1.編制一個可供使用的標(biāo)準(zhǔn)化的心理與教育測驗(yàn),一般要經(jīng)過以下幾個步驟:
①確定測驗(yàn)?zāi)康摹?/font>②制定編題計(jì)劃。③編輯測驗(yàn)項(xiàng)目。④預(yù)測與分析。
⑤合成測驗(yàn)。 ⑥測驗(yàn)標(biāo)準(zhǔn)化。 ⑦鑒定測驗(yàn)。 ⑧編寫測驗(yàn)說明書。
2.①施測前應(yīng)做好準(zhǔn)備工作;
②指導(dǎo)語應(yīng)不要暗示受測者應(yīng)該選什么;
③進(jìn)行測驗(yàn)時不能受到外界和施測者的干擾;
④評分時要客觀公正。
3.①主試應(yīng)充分了解測驗(yàn)的性質(zhì)與功能。②對導(dǎo)致測驗(yàn)結(jié)果的原因的解釋應(yīng)慎重,謹(jǐn)防片面極端。③必須充分估計(jì)測驗(yàn)的常模和效度的局限性。④解釋分?jǐn)?shù)應(yīng)參考其他有關(guān)資料。⑤對測驗(yàn)分?jǐn)?shù)應(yīng)以"一段分?jǐn)?shù)"來解釋,而不應(yīng)以"特定的數(shù)值"來解釋。⑥對來自不同測驗(yàn)的分?jǐn)?shù)不能直接加以比較。
4.①使用當(dāng)事人所理解的語言。
②要保證當(dāng)事人知道這個測驗(yàn)測量或預(yù)測什么,這里并不需要作詳細(xì)的技術(shù)性解釋。
③如果分?jǐn)?shù)是以常模為參考的,就要使當(dāng)事人知道他是和什么團(tuán)體在進(jìn)行比較。
④要使當(dāng)事人認(rèn)識到分?jǐn)?shù)只是一個估計(jì)。
⑤要使當(dāng)事人知道如何運(yùn)用他的分?jǐn)?shù)。
⑥要考慮測驗(yàn)分?jǐn)?shù)將給受測者帶來什么影響。
⑦測驗(yàn)結(jié)果應(yīng)向無關(guān)的人員保密。
⑧對低分者的解釋應(yīng)謹(jǐn)慎小心。
⑨報(bào)告測驗(yàn)分?jǐn)?shù)時應(yīng)設(shè)法了解當(dāng)事人的心理感受,并采取適當(dāng)?shù)拇胧┘右砸龑?dǎo)。
第十章
目標(biāo)參照測驗(yàn)>>練習(xí)與思考
練習(xí)與思考:
1.請根據(jù)表10.3中專家評定結(jié)果的平均數(shù)對表中14道題目的內(nèi)容效度進(jìn)行評定,并決定題目的取舍。
2.目標(biāo)參照測驗(yàn)的題目區(qū)分度可以通過哪些方法來確定?
3.目標(biāo)參照測驗(yàn)的信度與效度為何不適宜以相關(guān)系數(shù)作為評價(jià)指標(biāo)?
4.試比較目標(biāo)參照測驗(yàn)與常模參照測驗(yàn)的異同。
5.試分析內(nèi)容范圍的界定在目標(biāo)參照測驗(yàn)的標(biāo)準(zhǔn)化過程中的重要性。
6.試分析分?jǐn)?shù)分界點(diǎn)在目標(biāo)參照測驗(yàn)的質(zhì)量評估中的作用。
7.試分析題目內(nèi)容效度與目標(biāo)參照測驗(yàn)的內(nèi)容效度間的聯(lián)系。
解答要點(diǎn):
1.首先進(jìn)行專家的取舍。由于第二位專家在所有題目上所評等級與各等級平均數(shù)之間的差異之和較大,因此可以不考慮該專家的意見,只保留另外八位專家的評定結(jié)果,并重新計(jì)算這八位專家評定結(jié)果的等級平均數(shù)。
其次根據(jù)八位專家評定結(jié)果的等級平均數(shù)對每道題目進(jìn)行評定,并決定題目的取舍。等級平均數(shù)越高,說明題目內(nèi)容與其欲測量的目標(biāo)內(nèi)容之間的匹配程度越高,即內(nèi)容效度越高。題目2、7、14、4、12、5、11的內(nèi)容效度很高(等級平均值均在4以上),可以得到完整的保留;題目1、3、6、9的內(nèi)容效度較高(等級平均值均在3-4之間),適當(dāng)修改后即可;題目8、13、10的內(nèi)容效度較差(等級平均值均在3以下),一般需做較大修改或直接刪除。
2.目標(biāo)參照測驗(yàn)的題目區(qū)分度可以通過計(jì)算題目的難度差值和題目得分與測驗(yàn)總分之間的相關(guān)系數(shù)來表示。難度差值包括掌握組-未掌握組鑒別指數(shù)和個人獲得指數(shù)兩種。
3.相關(guān)系數(shù)受到受測者團(tuán)體異質(zhì)性的影響,團(tuán)體的異質(zhì)性越高,測驗(yàn)分?jǐn)?shù)的分布就越廣,所計(jì)算出來的相關(guān)系數(shù)就接近真實(shí)值。由于目標(biāo)參照測驗(yàn)的目的在于了解個體在所測內(nèi)容上的掌握水平,因此大多數(shù)情況下,被試團(tuán)體在目標(biāo)參照測驗(yàn)上的分?jǐn)?shù)分布比較集中,并且絕大多數(shù)被試都能夠達(dá)到所要求的水平。如果用相關(guān)系數(shù)作為信效度指標(biāo),由于受到分?jǐn)?shù)分布的影響,即使該測驗(yàn)本身具有較高的穩(wěn)定性和一致性,所得的信度系數(shù)也會和低,所以目標(biāo)參照測驗(yàn)的信度與效度不適宜以相關(guān)系數(shù)作為評價(jià)指標(biāo)。
4.常模參照測驗(yàn)的目的在于度量和比較個體之間的差異,并以被試在團(tuán)體中的相對位置來評價(jià)和解釋測量結(jié)果。目標(biāo)參照測驗(yàn)的主要目的則在于了解個體在所規(guī)定的測量內(nèi)容上的行為水平,其出發(fā)點(diǎn)是個體本身的絕對水平,而不再是個體間的水平差異。由于測驗(yàn)性質(zhì)的不同和受測人群可能存在的差異,兩種測驗(yàn)的項(xiàng)目分析和信效度評估需采用不同的方法和評價(jià)指標(biāo)。另外,目標(biāo)參照測驗(yàn)通常要根據(jù)切割分?jǐn)?shù)線對被試進(jìn)行分類,所以在目標(biāo)參照測驗(yàn)中對分?jǐn)?shù)分界點(diǎn)的確定具有十分重要的意義。
5.從目標(biāo)參照測驗(yàn)的定義來看,構(gòu)成測驗(yàn)的各個項(xiàng)目是否合適,測驗(yàn)是否有效,測驗(yàn)的分?jǐn)?shù)是否能夠得到有意義而準(zhǔn)確的解釋,這一切的前提都在于測驗(yàn)有沒有明確的目的以及與之相應(yīng)的嚴(yán)格界定的內(nèi)容范圍。因此對于目標(biāo)參照測驗(yàn)而言,測驗(yàn)編制的前期過程,尤其是內(nèi)容范圍的確定十分重要。
6.在目標(biāo)參照測驗(yàn)的實(shí)際應(yīng)用中,常常要根據(jù)分?jǐn)?shù)分界點(diǎn)來判斷某考生是否達(dá)到了升一個年級或畢業(yè)所要求掌握的最低知識技能水平,或者是否達(dá)到了從事特定專業(yè)工作所需的最低水平。這個分?jǐn)?shù)分界點(diǎn)的確定科學(xué)與否,直接決定了我們最終決策的正確與否。因此分?jǐn)?shù)分界點(diǎn)在目標(biāo)參照測驗(yàn)的質(zhì)量評估中具有十分重要的作用。
7.題目內(nèi)容效度與目標(biāo)參照測驗(yàn)的內(nèi)容效度之間有著重要的聯(lián)系。要確定目標(biāo)參照測驗(yàn)是否有效,必須首先要對構(gòu)成測驗(yàn)的每一個題目是否合適以及有效性進(jìn)行分析,即檢驗(yàn)題目與測驗(yàn)內(nèi)容范圍所要求的內(nèi)容與目標(biāo)的一致性。目標(biāo)參照測驗(yàn)注重被試在其所測內(nèi)容范圍內(nèi)的掌握程度,測驗(yàn)本身的題目組成對其欲測的內(nèi)容范圍的覆蓋程度或代表性程度--即測驗(yàn)的內(nèi)容效度-- 顯得尤其重要。
第十一章
學(xué)績測驗(yàn)>>練習(xí)與思考
練習(xí)與思考:
1.結(jié)合實(shí)際的測驗(yàn)例子試述學(xué)績測驗(yàn)的性質(zhì)和作用。
2.就《心理與教育測量》前10章內(nèi)容,設(shè)計(jì)一份測驗(yàn)編制計(jì)劃。(此題為思考題)
3.標(biāo)準(zhǔn)化學(xué)績測驗(yàn)的標(biāo)準(zhǔn)化要求有哪些?如何才能做到?
4.舉例說明診斷測驗(yàn)如何實(shí)現(xiàn)它的診斷功能?
(此題為思考題)
5.題庫的基本要求是哪些?你認(rèn)為建設(shè)題庫有些什么好處?
6.就你的經(jīng)驗(yàn)談?wù)劷處熥跃帨y驗(yàn)存在哪些不是?改進(jìn)的途徑是什么?
解答要點(diǎn):
1.學(xué)績測驗(yàn)是對個體在一個階段的學(xué)習(xí)或訓(xùn)練之后知識、技能的發(fā)展水平的測定,學(xué)績測驗(yàn)與能力測驗(yàn)一樣在測量學(xué)中屬于最佳行為測驗(yàn),其所測對象為個體的認(rèn)知性心理品質(zhì),主要包括知識能力兩個方面。學(xué)績測驗(yàn)有時也用來預(yù)測被試在今后的學(xué)習(xí)或工作中的成就,但是它與一般的性向測驗(yàn)有所不同。
學(xué)校使用學(xué)績測驗(yàn)鑒定學(xué)生的學(xué)績成績以及輔助本學(xué)校的教學(xué)管理;現(xiàn)代社會的人事管理中的人員取錄、晉職提級常以學(xué)績測驗(yàn)成績作為重要的評價(jià)標(biāo)準(zhǔn);教育科學(xué)研究工作者利用學(xué)績測驗(yàn)信息評價(jià)教育決策、優(yōu)選教育方案。
3.標(biāo)準(zhǔn)化學(xué)績測驗(yàn)的標(biāo)準(zhǔn)化要求包括:
(一)命題組卷標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化試卷的試題測量目標(biāo)明確,語詞意義清晰、試題難度、區(qū)分度達(dá)到規(guī)定標(biāo)準(zhǔn)。全卷的結(jié)構(gòu)與測量的目標(biāo)一致,題型比例恰當(dāng),題量適度,試題難度分布符合規(guī)定要求,試卷的信、效度都達(dá)到規(guī)定標(biāo)準(zhǔn)。
(二)施測標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化測驗(yàn)必須在統(tǒng)一標(biāo)準(zhǔn)的環(huán)境下施測,統(tǒng)一標(biāo)準(zhǔn)環(huán)境包括測驗(yàn)場所的標(biāo)準(zhǔn)統(tǒng)一、測驗(yàn)時間統(tǒng)一、測驗(yàn)的指導(dǎo)語統(tǒng)一、提供給考生的測驗(yàn)材料統(tǒng)一、材料出示的順序統(tǒng)一。
(三)評分標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化測驗(yàn)的答案要正確、規(guī)范、唯一,評分規(guī)則應(yīng)盡量細(xì)致、客觀、最好是沒有伸縮性。
(四)測驗(yàn)分?jǐn)?shù)解釋標(biāo)準(zhǔn)化。對于常模參照測驗(yàn),必須編制好測驗(yàn)常模;對于目標(biāo)參照測驗(yàn)必須認(rèn)真研究教材和教學(xué)大綱,分析合格標(biāo)準(zhǔn)的確切含義,通過調(diào)整試卷難度結(jié)構(gòu)準(zhǔn)確劃定合格分?jǐn)?shù)線。
5.題庫的基本要求包括:
(1)植基于一種科學(xué)的測量理論;
(2)儲備有一定數(shù)量的試題,所有試題品質(zhì)優(yōu)良,技術(shù)參數(shù)完備;
(3)題庫內(nèi)容結(jié)構(gòu)層次清楚、分類嚴(yán)謹(jǐn),試題檢索方便;
(4)題庫管理方便、可控性強(qiáng)、易于維護(hù)更新;
(5)保密性強(qiáng),應(yīng)用題庫組拼標(biāo)準(zhǔn)化學(xué)績測驗(yàn)的試卷,具有經(jīng)濟(jì)、高效、保密性強(qiáng)等優(yōu)點(diǎn)。
6.(一)教師要深入研究教材,深入調(diào)查學(xué)生。僅憑經(jīng)驗(yàn)命題容易形成所測內(nèi)容往往只涉及自己熟悉的或自己注重的內(nèi)容,考試對象只以自己熟悉的或親近學(xué)生為代表,這樣會造成命題試卷內(nèi)容部全面,或脫離學(xué)生實(shí)際。
(二)要維護(hù)準(zhǔn)確穩(wěn)定的合格標(biāo)準(zhǔn)。所謂準(zhǔn)確就是要保證凡被評為合格的學(xué)生確實(shí)都是達(dá)到教學(xué)基本要求的人,凡被評為部合格的學(xué)生確實(shí)是未達(dá)到學(xué)科基本要求的人,要盡量減少誤判之處;所謂穩(wěn)定,就是在各次測驗(yàn)中都維持同一個合格標(biāo)準(zhǔn),不能忽高忽低。
(三)要客觀評價(jià)自己的命題技術(shù),合理使用各種題型。定向反應(yīng)型試題命題技術(shù)要求比較高,沒有一定的命題經(jīng)驗(yàn)和技術(shù),編寫定向反應(yīng)型試題,有時反而會達(dá)不到預(yù)期的要求。
(四)要注意總結(jié)命題經(jīng)驗(yàn),提高命題技術(shù)。教師要通過不斷總結(jié)成功、反思失敗,逐漸掌握命題的各種技巧。總結(jié)命題經(jīng)驗(yàn)還具體包括不斷積聚優(yōu)秀試題,不斷充實(shí)個人的題庫。
(五)要盡量控制評分誤差,防止簡單粗糙。教師自編測驗(yàn)應(yīng)防止評分簡單粗糙、草率從事,要防止簡單地以對錯判分,特別是對于自由反應(yīng)型試題評分應(yīng)詳細(xì)分析學(xué)生的作答過程,評價(jià)他的思維方式和思維水平。
(六)要做一些定量分析研究。教師在自編測驗(yàn)施測后對試卷做一些定量的分析研究,比如計(jì)算試題難度、區(qū)分度、信度、效度等,可以逐步總結(jié)命題經(jīng)驗(yàn),提高命題技術(shù)。
第十二章
能力測驗(yàn)(上)>>練習(xí)與思考
練習(xí)與思考:
1.試談智力測驗(yàn)的效度問題。
2.智力測驗(yàn)的功能是什么?
3.為什么說"智力測驗(yàn)前并非人人平等"?
4.試析智力測驗(yàn)存在的合理性。
5.試析智力的形式與發(fā)展過程中的遺傳與環(huán)境的關(guān)系。(此題為思考題)
解答要點(diǎn):
1.結(jié)構(gòu)效度方面,傳統(tǒng)的智力測驗(yàn)是在智力G因素論的基礎(chǔ)上編制的,但G因素論仍存在很多問題。關(guān)于智力測驗(yàn)的結(jié)構(gòu)效度,目前只能做狹義的解釋,即以不同智力理論模型為基礎(chǔ)的智力測驗(yàn),其結(jié)構(gòu)效度應(yīng)具備不同的含義,并且最終對測驗(yàn)結(jié)果的解釋也相應(yīng)不同。
預(yù)測效度方面,智力測驗(yàn)對個體的未來成就進(jìn)行預(yù)測時,首先假定所測的智力是個體相當(dāng)穩(wěn)定的特質(zhì)。但事實(shí)上智力會因?yàn)槟承┮蛩囟l(fā)生變化。由于智力的可變性,利用智力測驗(yàn)來預(yù)測個體今后的可能成功程度的效能有被夸大的可能。
2.傳統(tǒng)智力測驗(yàn)的功能是對智力的個體差異的測量,在實(shí)際應(yīng)用中常常行使將人群分類的功能。傳統(tǒng)智力測驗(yàn)也常被用做預(yù)測源測驗(yàn)行使預(yù)測的功能。
3.智力測驗(yàn)存在著性別差異、職業(yè)差異文化和教育差異。
有研究表明男性和女性在不同的能力因素上存在著差異。而一般的智力測驗(yàn)都包括多種性質(zhì)的題目,有些可能更適于男性,有些則更適于女性,因此智力測驗(yàn)本身的內(nèi)容和結(jié)構(gòu)對男女兩性未必公平。
關(guān)于智力的職業(yè)差異的異類研究表明不同職業(yè)的人在智商上具有明顯的差異,這可能是由于傳統(tǒng)的智力測驗(yàn)并不能全面反映人的各方面能力的原因。而僅以智商高低來判斷人的智愚也是不充分的。
智力測驗(yàn)結(jié)果反映出來的城鄉(xiāng)差異和種族差異,并不能完全歸因于城鄉(xiāng)或種族本身由遺傳引起的差異,事實(shí)上文化和教育因素可能在此起了主導(dǎo)作用。
4.智力具有穩(wěn)定性,這種穩(wěn)定性表現(xiàn)在個體智力在其相應(yīng)團(tuán)體中的相對位置長時期內(nèi)保持穩(wěn)定,個體智力的相對穩(wěn)定性為智力測驗(yàn)具有一定預(yù)測效度提供了可能性;智力測驗(yàn)被實(shí)踐證明對學(xué)生和職業(yè)等效標(biāo)的預(yù)測具有較好的效度,可以有效地幫助決策者提高決策正確率;盡管智力測驗(yàn)對不同團(tuán)體可能存在不公平,但我們更應(yīng)該看重其預(yù)測效度;至盡仍無更有效的智力評估工具。