Разработчик(и) | Норман Х. Ни , Дейл Х. Бент, К. Хэдлай Халл |
---|---|
Первоначальный выпуск | 1968 ( 1968 ) |
Стабильный релиз | 30.0.0 [1] [2] [3] / 30 сентября 2024 г. |
Операционная система | Windows ( x86-64 ), macOS (x86-64), Linux (x86-64, ppc64le , IBM Z ) [4] |
Платформа | Ява |
Размер | ~1,2 ГБ |
Тип | Статистический анализ Численный анализ |
Лицензия | Подписка или корпоративное лицензирование [5] |
Веб-сайт | www.ibm.com/spss |
SPSS Statistics — это статистический программный пакет, разработанный IBM для управления данными , расширенной аналитики, многомерного анализа , бизнес-аналитики и уголовного расследования . Долгое время производился SPSS Inc. , был приобретен IBM в 2009 году. Версии программного обеспечения, выпущенные с 2015 года, имеют торговую марку IBM SPSS Statistics .
Первоначально название программного обеспечения расшифровывалось как «Статистический пакет для социальных наук» ( SPSS ) [6] , что отражало первоначальный рынок, а затем было изменено на «Статистические решения для продуктов и услуг» [7] [8] .
SPSS — широко используемая программа для статистического анализа в социальных науках . [9] Она также используется исследователями рынка, исследователями здравоохранения, компаниями, проводящими опросы, правительством, исследователями в сфере образования, отраслями промышленности, маркетинговыми организациями, сборщиками данных [10] и другими. Оригинальное руководство по SPSS (Nie, Bent & Hull, 1970) [11] было описано как одна из «самых влиятельных книг по социологии», поскольку оно позволяет обычным исследователям проводить собственный статистический анализ. [12] Помимо статистического анализа, управление данными (выбор случаев, изменение формы файла и создание производных данных) и документирование данных ( словарь метаданных хранится в файле данных ) являются функциями базового программного обеспечения.
Многие функции SPSS Statistics доступны через раскрывающиеся меню или могут быть запрограммированы с помощью фирменного языка синтаксиса команд 4GL . Программирование синтаксиса команд имеет преимущества воспроизводимого вывода, упрощения повторяющихся задач и обработки сложных манипуляций данными и анализов. Кроме того, некоторые сложные приложения могут быть запрограммированы только в синтаксисе и не доступны через структуру меню. Интерфейс раскрывающегося меню также генерирует синтаксис команд: он может отображаться в выводе, хотя настройки по умолчанию должны быть изменены, чтобы сделать синтаксис видимым для пользователя. Их также можно вставить в файл синтаксиса с помощью кнопки «вставить», присутствующей в каждом меню. Программы могут запускаться интерактивно или автоматически, используя поставляемый Production Job Facility.
Для написания подпрограмм командного языка можно использовать язык «макро» . Расширение программирования Python может получать доступ к информации в словаре данных и данным и динамически создавать программы синтаксиса команд. Это расширение, представленное в SPSS 14, заменило менее функциональные «скрипты» SAX Basic для большинства целей, хотя SaxBasic остается доступным. Кроме того, расширение Python позволяет SPSS запускать любую статистику в свободном программном пакете R. Начиная с версии 14, SPSS может управляться извне программой Python или VB.NET с помощью поставляемых «плагинов». (Начиная с версии 20 эти два средства создания скриптов, а также многие скрипты, включены в установочный носитель и обычно устанавливаются по умолчанию.)
SPSS Statistics накладывает ограничения на внутреннюю структуру файла, типы данных , обработку данных и файлы сопоставления, что в совокупности значительно упрощает программирование. Наборы данных SPSS имеют двумерную структуру таблицы, где строки обычно представляют случаи (например, отдельные лица или домохозяйства), а столбцы представляют измерения (например, возраст, пол или доход домохозяйства). Определены только два типа данных: числовые и текстовые (или «строковые»). Вся обработка данных происходит последовательно от случая к случаю через файл (набор данных). Файлы могут быть сопоставлены один к одному и один ко многим , но не многие ко многим . В дополнение к этой структуре и обработке случаев по переменным, существует отдельный сеанс Matrix, где можно обрабатывать данные как матрицы, используя операции матрицы и линейной алгебры.
Графический пользовательский интерфейс имеет два вида, которые можно переключать. «Просмотр данных» показывает вид электронной таблицы случаев (строк) и переменных (столбцов). В отличие от электронных таблиц, ячейки данных могут содержать только числа или текст, и в этих ячейках нельзя хранить формулы. «Просмотр переменных» отображает словарь метаданных, где каждая строка представляет переменную и показывает имя переменной, метку переменной, метки значений, ширину печати, тип измерения и множество других характеристик. Ячейки в обоих видах можно редактировать вручную, определяя структуру файла и позволяя вводить данные без использования синтаксиса команд. Этого может быть достаточно для небольших наборов данных. Более крупные наборы данных, такие как статистические опросы , чаще создаются в программном обеспечении для ввода данных или вводятся во время личного интервьюирования с помощью компьютера , путем сканирования и использования программного обеспечения для оптического распознавания символов и оптического распознавания меток или путем прямого захвата из онлайн-анкет. Затем эти наборы данных считываются в SPSS.
SPSS Statistics может считывать и записывать данные из текстовых файлов ASCII (включая иерархические файлы), других статистических пакетов, электронных таблиц и баз данных . Он также может считывать и записывать данные во внешние реляционные таблицы баз данных через ODBC и SQL .
Статистический вывод осуществляется в файле собственного формата (файл *.spv, поддерживающий сводные таблицы ), для которого, в дополнение к встроенному просмотрщику, можно загрузить автономный ридер. Собственный вывод может быть экспортирован в текст или Microsoft Word , PDF , Excel и другие форматы. В качестве альтернативы вывод может быть получен в виде данных (с помощью команды OMS), текста, текста с разделителями табуляции, PDF, XLS , HTML , XML , набора данных SPSS или различных графических форматов изображений ( JPEG , PNG , BMP и EMF ).
Существует несколько вариантов SPSS Statistics. SPSS Statistics Gradpacks — это версии со значительной скидкой, продаваемые только студентам. [13] SPSS Statistics Server — это версия программного обеспечения с архитектурой клиент/сервер . Дополнительные пакеты могут улучшить базовое программное обеспечение дополнительными функциями (примерами являются сложные выборки , которые можно настроить для кластеризованных и стратифицированных выборок, и пользовательские таблицы , которые можно создавать готовые к публикации таблицы). SPSS Statistics доступен по годовой или ежемесячной подписной лицензии.
Версия 25 SPSS Statistics была выпущена 8 августа 2017 года. Она добавила новые и расширенные статистические данные, такие как результаты решения случайных эффектов (GENLINMIXED), надежные стандартные ошибки (GLM/UNIANOVA) и профильные графики с планками погрешностей в надстройке Advanced Statistics and Custom Tables. V25 также включает новые возможности байесовской статистики , метод статистического вывода и готовые к публикации диаграммы, такие как мощные новые возможности построения диаграмм, включая новые шаблоны по умолчанию и возможность совместного использования с приложениями Microsoft Office. [14]
SPSS был выпущен в своей первой версии в 1968 году как Статистический пакет для социальных наук (SPSS) после того, как был разработан Норманом Х. Ни , Дейлом Х. Бентом и К. Хэдлаем Халлом. Эти руководители объединились как SPSS Inc. в 1975 году. Ранние версии SPSS Statistics были написаны на Фортране и разработаны для пакетной обработки на мэйнфреймах , включая, например, версии IBM и ICL , изначально использовавшие перфокарты для ввода данных и программ. Прогон обработки считывал командный файл команд SPSS и либо необработанный входной файл данных фиксированного формата с одним типом записи, либо «getfile» данных, сохраненных предыдущим запуском. Чтобы сэкономить драгоценное машинное время, можно было выполнить запуск «редактирования» для проверки синтаксиса команды без анализа данных. Начиная с версии 10 (SPSS-X) в 1983 году, файлы данных могли содержать несколько типов записей.
До версии SPSS 16.0 были доступны различные версии SPSS для Windows , Mac OS X и Unix .
SPSS Statistics версии 13.0 для Mac OS X несовместима с компьютерами Macintosh на базе Intel из-за программного обеспечения эмуляции Rosetta, вызывающего ошибки в расчетах. SPSS Statistics 15.0 для Windows требовала установки загружаемого исправления для совместимости с Windows Vista .
Начиная с версии 16.0, эта же версия работает под Windows, Mac и Linux. Графический пользовательский интерфейс написан на Java . Версия для Mac OS предоставляется как универсальный двоичный файл , что делает ее полностью совместимой как с PowerPC, так и с оборудованием Mac на базе Intel.
SPSS Inc объявила 28 июля 2009 года, что она приобретается IBM за 1,2 миллиарда долларов США. [22] Из-за спора о праве собственности на название «SPSS» в период с 2009 по 2010 год продукт назывался PASW (Predictive Analytics SoftWare). [23] С января 2010 года он стал «SPSS: An IBM Company». Полная передача бизнеса IBM была осуществлена к 1 октября 2010 года. К этой дате SPSS: An IBM Company прекратила свое существование. IBM SPSS теперь полностью интегрирована в IBM Corporation и является одним из брендов в рамках портфеля бизнес-аналитики IBM Software Group вместе с IBM Algorithmics , IBM Cognos и IBM OpenPages .
Сопутствующее программное обеспечение в семействе «IBM SPSS» используется для интеллектуального анализа данных и текстовой аналитики ( IBM SPSS Modeler ), служб кредитного скоринга в реальном времени (IBM SPSS Collaboration and Deployment Services) и моделирования структурных уравнений (IBM SPSS Amos).
SPSS Data Collection и SPSS Dimensions были проданы в 2015 году компании UNICOM Systems, Inc., подразделению UNICOM Global , и объединены в интегрированный программный пакет UNICOM Intelligence (разработка опроса, развертывание опроса, сбор данных, управление данными и составление отчетов). [24] [25] [26]
IDA (Interactive Data Analysis) [27] — программный пакет, созданный в бывшем Национальном центре изучения общественного мнения ( NORC ) в Чикагском университете . Первоначально предлагавшийся на HP-2000 [ 28 ] несколько позже, под управлением SPSS, он также был доступен на MUSIC/SP [ 29] Регрессионный анализ был одной из сильных сторон IDA [ 28] .
SCSS был программным продуктом, предназначенным для использования в режиме онлайн на мэйнфреймах IBM. [30]
Хотя «C» означало «разговорный», это также представляло собой различие в способе хранения данных: использовалась столбчатая, а не строковая (внутренняя) база данных. [ необходима цитата ]
Это дало хорошее время интерактивного отклика для SPSS Conversational Statistical System (SCSS), сильной стороной которой, как и в SPSS, было перекрестное табуляция. [31]
В октябре 2020 года IBM объявила о начале программы раннего доступа к «New SPSS Statistics» под кодовым названием Project NX. [32] [33] Она содержит «многие из ваших любимых возможностей SPSS, представленные в новом удобном интерфейсе с интегрированным руководством, несколькими вкладками, улучшенными графиками и многим другим».
В декабре 2021 года IBM открыла программу раннего доступа к следующему поколению SPSS Statistics для большего числа пользователей и поделилась дополнительными визуальными материалами о ней. [34] [35]