ВУЗ:
Составители:
Рубрика:
7
1. ВВЕДЕНИЕ В «АНАЛИЗ ДАННЫХ»
1.1. Работа с данными
Данные – это воспринимаемые человеком факты,
события, сообщения, измеряемые характеристики,
регистрируемые сигналы.
Специфика данных в том, что они, с одной стороны,
существуют независимо от наблюдателя, а с другой –
становятся собственно «данными» лишь тогда, когда
существует целенаправленно собирающий их субъект. В
итоге: данные должны быть тем основанием, на котором
возводятся все заключения, выводы и решения. Они
вторичны по отношению к цели исследования и
предметной области, но первичны по отношению к
методам их обработки и анализа, извлекающим из данных
только ту информацию, которая потенциально доступна в
рамках отобранного материала.
Данные получаются в результате измерений. Под
измерением понимается присвоение символов образцам в
соответствии с некоторым правилом. Эти символы могут
быть буквенными или числовыми. Числовые символы
также могут представлять категории или быть числовыми.
Различают 4 типа шкал измерений:
1) Шкала наименований. Эта шкала используется
только для классификации. Каждому классу данных
присваивается свое обозначение так, чтобы обозначения
различных классов не совпадали. Например,
классификация людей по полу М и Ж (1 и 2, 10 и 100) или
категория да/нет. Причем арифметические операции не
имеют смысла для шкал наименований. Для данной шкалы
1. ВВЕДЕНИЕ В «АНАЛИЗ ДАННЫХ»
1.1. Работа с данными
Данные – это воспринимаемые человеком факты,
события, сообщения, измеряемые характеристики,
регистрируемые сигналы.
Специфика данных в том, что они, с одной стороны,
существуют независимо от наблюдателя, а с другой –
становятся собственно «данными» лишь тогда, когда
существует целенаправленно собирающий их субъект. В
итоге: данные должны быть тем основанием, на котором
возводятся все заключения, выводы и решения. Они
вторичны по отношению к цели исследования и
предметной области, но первичны по отношению к
методам их обработки и анализа, извлекающим из данных
только ту информацию, которая потенциально доступна в
рамках отобранного материала.
Данные получаются в результате измерений. Под
измерением понимается присвоение символов образцам в
соответствии с некоторым правилом. Эти символы могут
быть буквенными или числовыми. Числовые символы
также могут представлять категории или быть числовыми.
Различают 4 типа шкал измерений:
1) Шкала наименований. Эта шкала используется
только для классификации. Каждому классу данных
присваивается свое обозначение так, чтобы обозначения
различных классов не совпадали. Например,
классификация людей по полу М и Ж (1 и 2, 10 и 100) или
категория да/нет. Причем арифметические операции не
имеют смысла для шкал наименований. Для данной шкалы
7
Страницы
- « первая
- ‹ предыдущая
- …
- 5
- 6
- 7
- 8
- 9
- …
- следующая ›
- последняя »
