<sub id="r97vb"><listing id="r97vb"></listing></sub>

        <sub id="r97vb"></sub>

      <address id="r97vb"><listing id="r97vb"></listing></address>

      <sub id="r97vb"><dfn id="r97vb"><ins id="r97vb"></ins></dfn></sub>

        <sub id="r97vb"><dfn id="r97vb"><mark id="r97vb"></mark></dfn></sub>
        <address id="r97vb"><dfn id="r97vb"></dfn></address>
        <sub id="r97vb"><var id="r97vb"><ins id="r97vb"></ins></var></sub>

        <address id="r97vb"><var id="r97vb"></var></address>
        <address id="r97vb"><var id="r97vb"><ins id="r97vb"></ins></var></address>

        <sub id="r97vb"><dfn id="r97vb"><output id="r97vb"></output></dfn></sub><thead id="r97vb"><var id="r97vb"><ins id="r97vb"></ins></var></thead><sub id="r97vb"><listing id="r97vb"></listing></sub>
        <address id="r97vb"><dfn id="r97vb"></dfn></address>
        <form id="r97vb"><dfn id="r97vb"></dfn></form>

        ? 首頁 ? 百科知識 ?作為基于證據推斷的測評

        作為基于證據推斷的測評

        時間:2020-03-29 百科知識 聯系我們
        作為基于證據推斷的測評_國際視野下大規模數學測評研究

        一、作為基于證據推斷的測評


        從一定程度上,教育測評的結果不同于物理意義上的測量,可以直接得到如身高或體重等結果。教育測評所要測評的是學生所知所能,與學生做出來的、被觀察到的不一定是同一件事。測量專家格利克森(H.Gulliksen)認為,測量理論的核心在于“個體的潛質或能力與他(或她)在測試中所得分數之間的關系。”[11]即把個體對一系列試題的反應與關于個體能力的假設之間的關系看作是數據性推理的問題。基于上述認識,分數和學生潛質或能力間的連接直接決定著測評結果的合理性和有效性。在這樣的認識下,相應的眾多方法,如經典測量理論(CTT)、項目反應理論(IRT)及潛在類別模型(Latent Class Model,以下簡稱LCM)等被用來對學生的所知所能進行推理。隨著認知科學的發展,這種不同于行為主義學習理論范式的形成,既拓展了學生對知識和技能的認識,又豐富了觀察學生表現證據的策略和種類。隨之而來的就是,面對如此多性向、多層次的復雜數據,如何處理形成上述推理所需的證據,無疑對測量人員提出了挑戰。

        為加深學生對獲取和使用知識的理解,并盡最大可能獲得測評中更為復雜的學生表現,如模仿、互動、合作甚至建構式回答等,無論是認知心理理論的發展,還是測量技術的發展,都正在逐步提供越來越多的、行之有效的支持和幫助。但是也存在著一些問題:認知心理理論和測量技術如何有效整合?兩者的內在一致性如何?在測評設計和結果分析中,如何針對測評的目的發揮出測評的最大效能?這些問題迫使我們重新思考測評形成過程的內在一致性的構架模式,即測評需要針對學生認知結構來收集復雜數據,并以此作出推斷或推測復雜的個體學習,評價復雜項目或相關組織系統,而這需要構建一個從觀察到推斷的完整推理鏈。

        上述模式不僅提出了對于測評效度的需求,而且為我們思考推理鏈的架構過程提供了線索。測量專家梅西克(S.Messick)指出,測評的數據為推斷和解釋等提供了概念性、實質性、統計意義上的支撐。[12]對于測評設計以結構為中心的方法,往往需要首先確定所要測評的相應復雜的內容,諸如知識、技能及其他性向,這些內容的復合體即結構。這些結構與教學目標及其他社會價值層面的東西有著或明或暗的聯系。其次,必須考慮何種行為或表現能反映這些結構,并思考哪些項目或情境能引起這些行為表現。總之,這些所要測評的結構特征驅使著相關項目的選擇或形成,包含基于結構的評分標準和相關準則的合理設計。這也體現出梅西克“以結構為中心”的測評設計理念。

        梅西克測評設計理念的價值在于,他將測評的設計跨越不同的測評目的,力求形成一種具有普適意義的模式,即將測評目的、各種數據、項目類型、評分方法及統計模型整合起來進行整體思考。哪些知識或技能需要測評?評分方法如何從學生表現中攫取相關線索?如何從多種項目中,或者通過比較不同學生在不同項目上的表現得出所需證據?可以說,測評設計過程中的每一步都會影響考生基于項目行為的推理鏈,這些項目都是用來測評學生的知識能力的。(www.toyotajt.cn)

        應該說,梅西克測評基于證據推理的理解,結合統計模型的發展,有利于我們采用基于統計意義上的推理模式來解決在測評中可能存在的不確定性等問題。而這些發展,一定程度上也反過來促使原有的測量理論有了新的發展,以便能從更復雜的數據信息中獲取更多樣或更復雜的推斷。

        基于上述對于測評以證據為中心構建整個推理鏈的認識,1994年,梅斯雷弗對測評中所涉及的相關證據及可能對應的所需推理等內容進行了詳細分析和闡述。[13]在其分析中指出,測評不是簡單設計一些“好的任務”,至少還要考慮如何對它們進行評分。從推斷的角度看,一個復雜的測評首先要明確推斷的目標,其次是根據目標形成相關觀察對象及觀察所需的情境等。從教育測評的角度看,上述目標就是學生所學的知識、技能和成就,而觀察對象就是學生所說所做的相關具體事情,在實際操作中往往通過學生在一定情境中對試題或任務的解決來獲取相關證據,再通過觀察、獲取的證據來推斷出學生知道什么和能做什么。因此,測評可以看成一個用來觀察學生行為和獲得數據的過程,而這些數據可以用來對學生所知所能進行合理推斷,即測評是基于證據的推理過程。可以看出,梅斯雷弗對于測評的相關理念直接來自于梅西克“以結構為中心”的測評設計理念。

        上述對于測評本質的認識,為評價的具體操作和組織奠定了基礎。從上述對測評即基于證據的推理過程的認識,可以理解測評的結果來自于估計,這種估計建立于對知識及對學生所知所能的表現進行抽樣。但值得注意的是,我們的推斷是在一個可能不確定的層面作出的。由于上述抽樣,我們所獲得的信息是不完全的,甚至具有不確定性,這容易導致形成不同的解釋和推斷,類似醫學診斷和智力分析。這需要我們在測評中合理運用相應的技術,并且嘗試對我們所觀察到的相關證據界定覆蓋面并賦予不同的權重系數。這里我們將遇到一個問題,即數據是否可作為證據?顯然數據和證據之間存在明顯區別。“在一些問題分析過程中,只有當數據與一個或更多個考慮中的假設建立起關聯時,數據才能成為證據。證據建立在一些假設的關聯上,它或增強或減弱了假設的可能性,沒有假設,也就沒有數據的關聯性建立。”[14]

        測評數據,只有當與各種推斷相聯系時才產生意義。同樣的觀察表現可以成為有些推斷的直接證據,也可以在其他推斷中成為間接證據,甚至根本沒有關系。在教育測評中,我們針對知識和技能等構建相關推斷,測評的評分是否與所測的知識和技能相聯系而真正成為證據,存在著眾多變數,如所測項目或試題的類型、測試所需時間和條件,甚至學生在測試當日的身體狀況等等。這些造成的直接結果就是,數據或評分不能成為學生所知所能推斷的直接證據。

        測評必須要考慮哪種證據或觀察是有助于推斷學生學業成就的,包括他的所知所能。這里就涉及有關學習特性的相關內容對測評數據和證據鏈形成的影響。認知研究,包括搜索學習者如何解決問題的證據,以及他們如何理解所要解決的問題。測量科學對此提供了有利于體現證據的各種方法來確定學習者的能力。整個推斷鏈確定了學生所言所行及所得結果中需尋找的內容,同時解決了為何所尋找的內容有助于推斷學生的所知所能,而這些都屬于測評設計的范疇。

        97色伦在色在线播放,午夜片神马福利在线观看,三级片电影网站