Образовательные информационные технологии. Часть 2. Педагогические измерения. Морев И.А. - 122 стр.

UptoLike

Составители: 

122
ляции результатов повторного тестирования более 0,75 уровень надежности теста прием-
лем.
Надёжность теста проверяется относительно
временных изменений;
выбора конкретных заданий;
конкретных индикаторов;
роли индивидуальности персонала при накоплении и обработке данных;
аспектов процедуры тестирования.
Вычисление ошибки измеренийвероятных пределов колебаний измеряемой величины
основано на понятии надёжности.
Ни один тест не является абсолютно надёжным. Дисперсия ошибки (мера отклонения ре-
зультатов сеансов тестирования) отражает случайные колебания, вызываемые неконтро-
лируемыми факторами:
тренинг и дообучение претендентов в течение периода измерения надежно-
сти;
изменениями погоды;
случайными отвлекающими моментами;
обучаемостью претендентов в течение сеанса и в перерывах между сеансами;
мотивированностью претендентов и ее изменениями;
адаптацией, привыканием претендентов к форме проведения тестирования;
изменениями состояния претендентов.
Первый из этих факторов, наиболее влияющий на результаты и «путающий все карты», –
обычное явление, создаваемое родителями, руководством учебных заведений, добросове-
стными педагогами, не желающими, чтобы их воспитанники предстали перед экспери-
ментаторами в худшем виде.
Стандартизация и компьютеризация тестов уравнивают условия тестирования и способст-
вуют повышению надежности.
Стандартный набор данных о тесте
, предназначенном для широкого употребления, обяза-
тельно должен включать сведения о мере его надёжности.
Надёжность обычно вычисляется с помощью коэффициента корреляции произведения
моментов К. Пирсона (его можно найти в статистических справочниках).
При измерении надежности следует обращать внимание на критерий целесообразности,
помнить об отношении «затратыпольза». Следует контролировать, в каком интервале
времени
измерялась надежность, произошли ли за этот период какие-либо события, спо-
собные повлиять на результаты.
Существуют различные типы надёжности и подходы к их вычислению. Педагогу, апроби-
рующему тест на своих классах, важнее всего владеть техникой измерения:
ретестовой надёжности;
надёжности эквивалентных форм.
Надежность не обязательно предполагает высокую валидность. Среди тестологов распро-
странено поверье, что на практике всегда выполняется следующее выражение: валидность
ляции результатов повторного тестирования более 0,75 уровень надежности теста прием-
лем.
Надёжность теста проверяется относительно
   •   временных изменений;
   •   выбора конкретных заданий;
   •   конкретных индикаторов;
   •   роли индивидуальности персонала при накоплении и обработке данных;
   •   аспектов процедуры тестирования.
Вычисление ошибки измерений – вероятных пределов колебаний измеряемой величины –
основано на понятии надёжности.
Ни один тест не является абсолютно надёжным. Дисперсия ошибки (мера отклонения ре-
зультатов сеансов тестирования) отражает случайные колебания, вызываемые неконтро-
лируемыми факторами:
   •   тренинг и дообучение претендентов в течение периода измерения надежно-
       сти;
   •   изменениями погоды;
   •   случайными отвлекающими моментами;
   •   обучаемостью претендентов в течение сеанса и в перерывах между сеансами;
   •   мотивированностью претендентов и ее изменениями;
   •   адаптацией, привыканием претендентов к форме проведения тестирования;
   •   изменениями состояния претендентов.
Первый из этих факторов, наиболее влияющий на результаты и «путающий все карты», –
обычное явление, создаваемое родителями, руководством учебных заведений, добросове-
стными педагогами, не желающими, чтобы их воспитанники предстали перед экспери-
ментаторами в худшем виде.
Стандартизация и компьютеризация тестов уравнивают условия тестирования и способст-
вуют повышению надежности.
Стандартный набор данных о тесте, предназначенном для широкого употребления, обяза-
тельно должен включать сведения о мере его надёжности.
Надёжность обычно вычисляется с помощью коэффициента корреляции произведения
моментов К. Пирсона (его можно найти в статистических справочниках).
При измерении надежности следует обращать внимание на критерий целесообразности,
помнить об отношении «затраты – польза». Следует контролировать, в каком интервале
времени измерялась надежность, произошли ли за этот период какие-либо события, спо-
собные повлиять на результаты.
Существуют различные типы надёжности и подходы к их вычислению. Педагогу, апроби-
рующему тест на своих классах, важнее всего владеть техникой измерения:
   •   ретестовой надёжности;
   •   надёжности эквивалентных форм.
Надежность не обязательно предполагает высокую валидность. Среди тестологов распро-
странено поверье, что на практике всегда выполняется следующее выражение: валидность

                                        122