// IBM SPSS: Отбор данных

// IBM SPSS: Отбор данных


В СПСС существует три принципиальные возможности отбора данных:

  • выбор наблюдений по определенному условию (логическому выражению);
  • извлечение случайной выборки наблюдений из файла данных;
  • разделение наблюдений на группы в соответствии со значениями одной или нескольких переменных.
Выбор наблюдений

"Если выполнено условие"

Классификация операторов:

  • арифметические
  • логические


  • операторы отношения

Функции:

Логические функции:

  • RANGE(переменная, начало диапазона, конец диапазона). Возвращает значение 1 (истинно), если значение переменной лежит в диапазоне между заданными начальным и конечными значениями. Пример:
  • ANY(variable, val1, val2,...). Возвращает значение 1 (истинно), если значение переменной (значение первого аргумента) совпадает по крайней мере с одним из значений, указанных в последующем списке параметров. В противном случае возвращает 0 (ложно). Не забывайте заключать строковые значения в двойные кавычки.

Строковые функции:

  • SUBSTR (variable, begin, length). Эта функция извлекает определенную часть из строки. Она возвращает подстроку или отдельный символ.
  • UPCASE (argument). Эта функция преобразует строчные буквы в прописные. UPCASE(name) вернет ALINA, если переменная "name" имеет значение "ALINA".
  • LOWER(arguement). Преобразует прописные в строчные.
Извлечение случайно выборки

Данные -> Выбрать наблюдения -> Случайная выборка -> Выборка

При большом количестве наблюдений для экономии временя может быть полезно использовать небольшую случайную выборку при первой предварительной проверке гипотезы.

В группе "Размер выборки" можно выбрать один из следующих способов определения объема выборки:

  • Приблизительно. Здесь можно указать процентное значение, СПСС создаст случайную выборку с объемом, приблизительно соответствующим указанному проценту наблюдений.
  • Точно. Пользователь должен указать здесь точное количество наблюдений в случайно выборке, а также указать количество наблюдений, из которых будет извлечена выборка.
Сортировка наблюдений

Данные -> Сортировать наблюдения

Если выбрать несколько переменных сортировки, их последовательность в списке "Сортировать по" будет определять порядок, в котором будут отсортированы наблюдения.

Разделение наблюдений на группы

В СПСС можно выполнять анализ данных раздельно по группам

Данные -> Файл разбиения

По умолчанию разделение группы не предполагается. Если выбрать пункт "Организовать вывод по группам", то получим вывод результатов по каждой группе отдельно.

Пункт "Сравнивать группы" организовывает вывод таким образом, что можно визуально сравнить разные группы друг с другом.

Файл данных останется разделенным на подгруппы, пока вы не деактивируете соответствующие опции: Данные -> Расщепить файл -> Анализировать все наблюдения, группы не создавать.


Report Page