Образовательные информационные технологии. Часть 2. Педагогические измерения. Морев И.А. - 116 стр.

UptoLike

Составители: 

116
Специалистами наиболее часто обсуждаются следующие характеристики тестов:
время измерения, т. е. сколько времени необходимо тестировать группу претен-
дентов для того, чтобы результаты тестирования стали достаточно валидными и
надежными;
привлекательность, т. е. насколько охотно претенденты избирают для своего тес-
тирования тот или иной тест;
простота создания (очень важная характеристика для условий поточного произ-
водства и для обеспечения экономичности производства);
простота применения (иными словами, насколько велики требования к квалифи-
кации специалистов его применяющих или обслуживающих, а также к технике и
оборудованию).
Этим характеристикам так же, как и приведенным выше свойствам, трудно сопоставить
точные количественные критерии. Однако их можно сравнить, основываясь на мнениях
экспертов, и, соответственно, ранжировать.
Дифференцирующая способность теста оценивается с точки зрения соответствия уровня
его трудности уровню подготовленности претендентов. Бесполезно давать слабым уча-
щимся трудные задания и знающим студентам легкие задания. В обоих случаях претен-
денты не будут различаться результатами. Измерение не состоится по причине несоответ-
ствия уровня трудности теста уровню подготовленности. Эффективный тест соответству-
ет по трудности заданий
уровню подготовленности испытуемых. Если включить в тест
задания для измерения на всем диапазоне изменения трудности, то снижается точность
измерения на отдельном участке. И наоборот, для точного измерения знаний претенден-
тов одинакового уровня подготовленности, требуется иметь больше заданий соответст-
вующего уровня трудности. Эффективный тест (с минимизированным количеством зада-
ний) не может
быть эффективным на всем диапазоне подготовленности претендентов.
Релевантность тестового комплекса. Редко обсуждается очень важная, на наш взгляд,
характеристика тестовых комплексов (а также технологий тестирования и учебных посо-
бий) – степень оптимальности соответствия учебным целям. Такую характеристику мож-
но назвать релевантностью. Понятие «релевантность» по своему смыслу близко понятию
«валидность», но охватывает больший смысловой круг, поскольку ранжирование претен-
дентов является лишь малой (безусловно
, важной) частью учебного процесса.
Педагогический тестовый комплекс создается с учетом единства семи систем:
системы знаний проверяемой учебной дисциплины;
системы заданий;
системы предъявления заданий испытуемым (алгоритм, интерфейс);
сценария тестирования;
системы методического обеспечения;
системы технического обеспечения;
системы статистической обработки результатов испытуемых.
Информация, которую содержит педагогический тестовый комплекс, меняется со време-
нем: включаются новые задания, меняются статистические веса заданий, меняются сцена-
рии и пр.
Специалистами наиболее часто обсуждаются следующие характеристики тестов:
   •   время измерения, т. е. сколько времени необходимо тестировать группу претен-
       дентов для того, чтобы результаты тестирования стали достаточно валидными и
       надежными;
   •   привлекательность, т. е. насколько охотно претенденты избирают для своего тес-
       тирования тот или иной тест;
   •   простота создания (очень важная характеристика для условий поточного произ-
       водства и для обеспечения экономичности производства);
   •   простота применения (иными словами, насколько велики требования к квалифи-
       кации специалистов его применяющих или обслуживающих, а также к технике и
       оборудованию).
Этим характеристикам так же, как и приведенным выше свойствам, трудно сопоставить
точные количественные критерии. Однако их можно сравнить, основываясь на мнениях
экспертов, и, соответственно, ранжировать.
Дифференцирующая способность теста оценивается с точки зрения соответствия уровня
его трудности уровню подготовленности претендентов. Бесполезно давать слабым уча-
щимся трудные задания и знающим студентам легкие задания. В обоих случаях претен-
денты не будут различаться результатами. Измерение не состоится по причине несоответ-
ствия уровня трудности теста уровню подготовленности. Эффективный тест соответству-
ет по трудности заданий уровню подготовленности испытуемых. Если включить в тест
задания для измерения на всем диапазоне изменения трудности, то снижается точность
измерения на отдельном участке. И наоборот, для точного измерения знаний претенден-
тов одинакового уровня подготовленности, требуется иметь больше заданий соответст-
вующего уровня трудности. Эффективный тест (с минимизированным количеством зада-
ний) не может быть эффективным на всем диапазоне подготовленности претендентов.
Релевантность тестового комплекса. Редко обсуждается очень важная, на наш взгляд,
характеристика тестовых комплексов (а также технологий тестирования и учебных посо-
бий) – степень оптимальности соответствия учебным целям. Такую характеристику мож-
но назвать релевантностью. Понятие «релевантность» по своему смыслу близко понятию
«валидность», но охватывает больший смысловой круг, поскольку ранжирование претен-
дентов является лишь малой (безусловно, важной) частью учебного процесса.
Педагогический тестовый комплекс создается с учетом единства семи систем:
   •   системы знаний проверяемой учебной дисциплины;
   •   системы заданий;
   •   системы предъявления заданий испытуемым (алгоритм, интерфейс);
   •   сценария тестирования;
   •   системы методического обеспечения;
   •   системы технического обеспечения;
   •   системы статистической обработки результатов испытуемых.
Информация, которую содержит педагогический тестовый комплекс, меняется со време-
нем: включаются новые задания, меняются статистические веса заданий, меняются сцена-
рии и пр.




                                           116