Скачать 0.59 Mb.
|
Совместный анализ
Тема 11. Меры средней тенденции и стоящие за ними модели. Формальная и содержательная адекватность мер средней тенденции. 11.1. Основные меры средней тенденции (повторение): математическое ожидание, мода, квантили. Их выборочные оценки. 11.2. Смысл формул, с помощью которых рассчитываются мода и медиана. Графический способ их нахождения. Модели, заложенные в этих способах расчета. Возможность получения разных значений медианы при использовании разных способов построения кумуляты. Объяснения этого факта. Характеристика ситуаций, когда имеют смысл «непрерывная» совокупность значений мер средней тенденции.
Основная литература 1. Толстова Ю.Н. Анализ социологических данных: методология, дескриптивная статистика, анализ связей между номинальными признаками. М.: Научный мир, 2000. С. 142-153. Дополнительная литература Тема 12. Меры разброса и стоящие за ними модели. Формальная и содержателная адекватность мер разброса. 12.1. Необходимость рассмотрения наряду со средними также и мер разброса. Повторение: дисперсия, вариационный размах, среднее абсолютное отклонение, квантильные размахи. Мера разброса значений номинального признака, основанная на оценке количества разнородных пар объектов. Энтропийный аналог дисперсии. Сравнение рассмотренных мер с точки зрения заложенных в них моделей..
Основная литература 1. Толстова Ю.Н. Анализ социологических данных: методология, дескриптивная статистика, анализ связей между номинальными признаками. М.: Научный мир, 2000. С. 153-163. Дополнительная литература РАЗДЕЛ III. ОБЪЯСНЕНИЕ: МЕТОДЫ АНАЛИЗА СТАТИСТИЧЕСКИХ СВЯЗЕЙ Тема 13. Цели и общие принципы анализа статистических связей. 13.1. Понятие причины в социологии. Принципиальная невозможность полностью его формализовать. Роль статистических методов при изучении причинных отношений. Проблема соотнесения статистической связи с причинностью; различие между статистической и причинной связью; понятие "ложной" корреляции. Основные причинные схемы, приводящие к их появлению. 13.2. Изучение связей и операционализация понятий. «Неуловимость» понятия причины
Основная литература.
Дополнительная литература.
Эксперимент в социологии
Тема 14. Анализ связей между числовыми признаками (понятие многомерной связи, обобщение коэффициента корреляции, канонический анализ, причинный анализ). Возможность использования «числовых» методов для дихотомических данных. 14.1. Понятие многомерной связи. Ее роль для социолога. 14.2. Понятие ковариации. Обобщение коэффициента корреляции: частный, множественный коэффициенты корреляции (множественный коэффициент корреляции и коэффициент детерминации - синонимы); понятие связи между двумя группами признаков; канонический коэффициент корреляции; рассмотрение его как обобщения множественного коэффициента корреляции. Выражение этих коэффициентов через коэффициенты парной корреляции (и через это выражение – понимание содержательного смысла коэффициента). 14.2. Канонический анализ: основная задача канонического анализа; последовательность канонических коэффициентов корреляции; принципы их получения на основе анализа таблицы сопряженности; использование канонической корреляции в анализе таблиц сопряженности; модели частот, отвечающие каноническому анализу; связь канонических коэффициентов корреляции с критерием «хи-квадрат». Канонический анализ как метод оцифровки и метод измерения связи между двумя номинальными признаками с «совместными альтернативами». Модели частот, отвечающие каноническому анализу. Построение социологических индексов с помощью техники канонического анализа. Решение проблемы взвешивания составляющих индекс признаков.
Основная литература
Дополнительная литература. Канонический анализ
Причинный анализ
Sage University Paper series on Quantitative applications in the social sciences;Beverly Hills: SAGE Publications, (“зеленая” серия). Следующие тома посвящены причинному анализу: 3.Asher H. Causal modeling, 1976,1980 34. Long. Covariance Structure Models, 1983 37. Berry W.D. Nonrecursive Causal Models, 1984 55. Davis. The Logic of causal Order 74. Brown, Melamed. Experimental design and analysis, 1990 105.Causal analysis of panel data, 1995 114. Jaccard J., Wan C.K. LISREL Approaches to Interaction Effects in Multiple regression 135. Jaccard J. Interaction effects in logistic regression, 2001 Имеется ридер SEM
Тема 15. Анализ связей между категориальным и числовым признаком (дисперсионный анализ). Дисперсионный анализ как способ корректного проведения эксперимента (повторение). Взаимодействия в дисперсионном анализе. Общие модели однофакторного и двухфакторного дисперсионного анализа. Выборочные оценки параметров модели. Гипотезы, проверяемые в однофакторном и двухфакторном дисперсионном анализе. Соответствующие критерии. Объяснение вида критерия для проверки гипотезы об отсутствии взаимодействия. Основная литература.
Дополнительная литература.
Тема 16. Анализ связей между категориальных признаками: классификация методов. Классификация методов анализа номинальных данных, основанная на гипотетическом «разбиении» всех признаков на отдельные альтернативы и выделение групп методов в зависимости от того, каким образом в процессе применения метода эти альтернативы «склеиваются»: методы типа «альтернатива х альтернатива», «группа альтернатив х группа альтернатив» и т.д. Основная литература. 1. Толстова Ю.Н. Анализ социологических данных: методология, дескриптивная статистика, анализ связей между номинальными признаками. М.: Научный мир, 2000. С. 169-187. Дополнительная литература. Тема 17. Анализ связей между категориальными признаками: алгоритмы типа «признак х признак» (парные коэффициенты связи, отношения преобладания), «(группа признаков) х (группа признаков)» (разложение частотной таблицы на четырехклеточные подтаблицы /анализ фрагментов таблиц сопряженности/, алгоритмы типа AID)
17.5. Методы поиска сочетаний значений предикторов (независимых признаков), детерминирующих «поведение» объектов: понятие зависимой и независимых переменных (функции и аргументов, следствия и причин); общая постановка задачи (поиск сочетаний значений независимых признаков /значений, которые, вообще говоря, могут «надергиваться» из разных признаков-предикторов/, детерминирующих определенное поведение респондентов; «лобовой» путь решения такого рода задач (перебор всевозможных сочетаний значений рассматриваемых признаков и проверка для каждого из них того, можно ли соответствующую совокупность объектов считать «олицетворением» определенного типа поведения: если нет - переходим к «проверке» следующего сочетания значений аргументов, если да – считаем, что нашли решение задачи; возможность вариаций понятия типа поведения и алгоритма перебора сочетаний значений предикторов; их относительная автономность; необходимость рассмотрения алгоритмов сокращенного перебора; заложенные в них модели; важность их анализа для социолога. Иллюстрация рассмотренных положений на примере алгоритма последовательных разбиений THAID. Выделение тех элементов этого алгоритма, которые имеют непосредственное отношение к пониманию типа поведения респондентов. Условия прекращения работы алгоритма. Их связь с пониманием искомых типов. Общие принципы работы алгоритма CHAID. Основная литература.
Дополнительная литература.
3. Magidson J. The CHAID approach to segmentation modeling // Handbook of marketing research. Cambridge, Mass.: Blackwell, 1993 4. Messenger R.S., Mandell G.M. A model search technique for predictive nominal scale multivariate analysis // J.Amer.Stat. ass. 1972. V.67. P.768-773 (алгоритм THAID) 5. Morgan J.N., Messenger R.C. THAID – a sequential analysis program for nominal dependent variables. Ann. Arbor: Institute for social research, 1973 Тема 18. Анализ связей между категориальными признаками: изучение системы признаков (логлиненый анализ, ЛЛА) ЛЛА: причины отклонения наблюдаемых частот от их средних значений, т. е. отличия реального распределения от равномерного; невозможность получения нового знания на основе анализа равномерного распределения (суть анализа данных - изучение изменений, сравнение показателей разного рода); модели частот, отвечающие логлинейному анализу; насыщенная модель; цель перехода к логарифмам частот; смысл вкладов разной размерности; гипотезы о взаимосвязи признаков, их роль при построении моделей частот; проблема формирования таких гипотез; роль критерия "хи-квадрат" при использовании логлинейного анализа; расчет коэффициентов логлинейной модели для двумерного случая. Интерпретация коэффициентов через отношения преобладания (для модели произвольной размерности). Основная литература.
Дополнительная литература. 1. Мирзоев А. А. Логлинейный анализ социологической информации // Многомерный анализ социологических данных (методические рекомендации, алгоритмы, описание программ). М.: ИСИ АН СССР, 1981. С. 118-131. 2.Мирзоев А. А. Применение логлинейного анализа для обработки данных социологических исследований // Математико-статистические методы анализа данных в социологических исследованиях. М. : ИСАН СССР, 1980. С. 49-60. 3. Knoke D., Durke R.J. Log-linear models // Sage University Paper series on Quantitative applications in the social sciences;Beverly Hills: SAGE Publications, v. 20
Тема 19. Обобщение понятия взаимодействия. Сравнение разных подходов к поиску обобщенных взаимодействий. 19.1. Обобщение понятия взаимодействия. Современные тенденции в развитии методов поиска обобщенных взаимодействий. 19.2. Сравнение логлинейного анализа (ЛЛА) с номинальным регрессионным и дисперсионным анализом, а также с методом последовательных разбиений (THAID). Сравнение осуществляется на содержательном уровне. Содержательная аналогия между вкладами сочетаний значений рассматриваемых признаков в моделях ЛЛА, с одной стороны, и коэффициентами для нелинейных членов уравнений номинального регрессионного анализа, взаимодействиями признаков в дисперсионном анализе, сочетаниями значений предикторов, детерминирующих определенное поведение респондентов, в методе последовательных разбиений - с другой. Различие содержательной интерпретации результатов реализации подходов, задействованных в названных методах. Разное понимание зависимого признака: количественный признак в дисперсионном анализе, количественный или номинальный - в номинальном регрессионном и частота, стоящая в клетке многомерной таблицы сопряженности, - в логлинейном анализе. Разные возможности поиска сочетаний значений предикторов: проверка гипотез о наличии многомерных связей в логлинейном анализе и возможность поиска наиболее действенных сочетаний в методе последовательных разбиений и регрессионном анализе, заранее заданный набор сочетаний значений предикторов в дисперсионном анализе. Смысл комплексного использования рассматриваемых методов при решении одной и той же социологической задачи. 19.3. Отличие математико-статистического понятия взаимодействия (в дисперсионном анализе) от взаимодействий в алгоритмах типа AID.
Основная литература. 1. Толстова Ю.Н. Анализ социологических данных: методология; дескриптивная статистика, анализ связей номинальных признаков. М.: Научный мир, 2000. С. 169-180 – понятие взаимодействия, его обобщение, краткий обзор методов поиска обобщенных взаимодействий. Литература по логлинейному анализу указана в теме 18, по методу последовательных разбиений - в теме 17, по дисперсионному анализу – в теме 15. Дополнительная литература. 1. Анализ нечисловой информации в социологических исследованиях. М.:Наука, 1987 . 2. Аптон Г. Анализ таблиц сопряженности. М. : Финансы и статистика, 1982. РАЗДЕЛ IV. ОБЪЯСНЕНИЕ: КЛАССИФИКАЦИЯ ОБЪЕКТОВ Тема 20. Цели классификации Классификация как один из фундаментальных способов получения нового знания. Разведение понятия «классификация» и «типология». Основная литература.
Дополнительная литература.
Тема 21. Классификация в числовом пространстве: общие принципы, краткий обзор методов, классификация и типология, основные рассматриваемые элементы формализма 21.1. Геометрическая постановка задачи. Признаковое пространство. Задача классификации как поиск сгущения точек – моделей объектов в признаковом пространстве (сравнить с традиционным для социолога определением группировки как выделения объектов, обладающих некоторым сочетанием значений рассматриваемых признаков и с методами поиска взаимодействий, т.е. сочетаний значений признаков – предикторов). 21.2. Задачи распознавания образов. Понятие автоматической классификации объектов: общее представление о задачах распознавания образов (синонимы: образ, класс, кластер, таксон; неоднозначность трактовки терминов в литературе). Выделение задач: поиск классов, описание классов, определение наиболее эффективной системы признаков. Роль наличия или отсутствия обучающей выборки. Выделение задачи автоматической классификации объектов (синонимы: многомерная классификация, распознавание образов без учителя, кластерный анализ, таксономия) как такой задачи классификации, при решении которой заранее не известно, каковы искомые классы, и нет обучающей выборки. Система признаков, описывающих объекты, будет считаться заданной (хотя это, вообще говоря, не обязательно). 21.3. Проблема «стыковки» содержания и формализма при использовании алгоритмов классификации. Специфика решения социологических задач построения типологии с помощью методов автоматической классификации. Смысл противопоставления терминов «классификация» и «типология». Основание типологии. Роль априорных представлений исследователя об искомых типах в выборе и реализации алгоритма, интерпретации результатов его применения. Выделение основных формальных элементов алгоритмов автоматической классификации, требующих стыковки с содержательными концепциями социолога. Основная литература
Дополнительная литература
Тема 22. Классификация в числовом пространстве: выбор функции расстояния между объектами и между классами, форма классов 22.1. Функции расстояния между объектами: напоминание аксиоматического определения функции расстояния и роли этой функции в социологии. Примеры непригодности евклидова расстояния с точки зрения априорного содержательного понимания искомых типов объектов. Такие модификации функций расстояния в рассмотренных примерах, которые делают их пригодными с содержательной точки зрения. Возможность использования евклидова расстояния в рассмотренных примерах за счет изменения признакового пространства. Рассмотрение этого факта как одной из реализаций общего принципа органической связи между измерением и анализом собранных с его помощью данных. Еще одна иллюстрация того же принципа: согласование функции расстояния с типом используемых шкал (формальная адекватность функции расстояния). Примеры недостаточности этого требования для выбора функции расстояния (необходимость содержательной адекватности этой функции характеру решаемой социологической задачи). Несоблюдение правила треугольника как основная причина непригодности многих эвристических функций расстояния. Возможность ослабления этого правила. Функции расстояния, отличные от евклидова: взвешенное евклидово, сити-блок, Махаланобиса, Хеммингово, косинус (коэффициент корреляции). 22.2. Основные виды процедур классификации. Расстояния между классами: иерархические и неиерархические, агломеративные и дивизимные алгоритмы; причины необходимости рассмотрения расстояний между классами в иерархических процедурах; алгоритм CLUSTER как пример способа классификации, использующего такие расстояния; способы измерения близости между классами; оптимизация разбиения в смысле максимизации заранее выбранного функционала качества как один из основных элементов формализма в неиерархических алгоритмах классификации; основной содержательный смысл такой оптимизации – стремление к тому, чтобы внутри классов объекты были как можно более близкими друг к другу, а классы были бы как можно дальше друг от друга; смысл измерения близости между классами в таких случаях. Способы измерения суммарных оценок близости друг к другу объектов внутри классов. Разные способы измерения расстояний между классами: минимум расстояний для всех таких пар объектов, один из которых принадлежит первому рассматриваемому классу, другой – второму; максимум таких же расстояний; среднее значение таких расстояний; расстояние между центрами тяжести классов. Примеры социологических задач, для которых содержательно адекватны разные способы измерения расстояний между классами. 2.3. Гипотезы о расположении объектов в признаковом пространстве. Роль таких гипотез о характере расположения объектов в выборе алгоритма классификации. Обусловленность этих гипотез априорными представлениями исследователя об искомых типах объектов. Основные виды гипотез: компактности, связности (непрерывности), унимодального распределения (при описании последней гипотезы необходимо дать определение функции принадлежности). Примеры социологических задач построения типологии, для которых была бы разумна каждая гипотеза. Примеры алгоритмов, ищущих закономерности расположения точек в признаковом пространстве, отвечающие каждой из гипотез: алгоритм Форэль (гипотеза компактности), алгоритм ближайшего соседа (гипотеза связности), алгоритм, основанный на выделении локальных максимумов функции принадлежности (гипотеза унимодального распределения). Общее представление о размытых классификациях. Роль функции принадлежности в соответствующих алгоритмах. Целесообразность комплексного использования нескольких алгоритмов классификации в социологичских задачах построения типологии. Содержательные представления социолога об искомых типах и условия выбора шага разбиения при интерпретации результатов. Корректировка результатов классификации с целью обеспечения соответствия классификации и типологии. Основная литература
Дополнительная литература.
Тема 23. Классификация категориальных данных (дихотомизация произвольных номинальных данных, функции расстояния для дихотомических данных, алгоритмы типа AID как методы классификации, ЛСА ).
Основная литература. 1. Раушенбах Г. В. Меры близости и сходства в социологии // Анализ нечисловой информации в социологических исследованиях. М. : Наука., 1985. С. 169-203. – функции расстояния для дихотомических данных О поиске взаимодействий см. литературу в теме 17, о ЛСА – в теме 8. Дополнительная литература. |
Методы в зависимости от типа социологических исследований подразделяются на качественные и количественные, а в зависимости от этапа... | Основные направления социологических исследований. Методы, используемые в рамках социологических исследований. Методологическая стратегия... | ||
Ок-3: готовностью к саморазвитию, самореализации, использованию творческого потенциала | В большой степени развитию этой дисциплины способствовало проникновение в сферу анализа данных идей, возникших в теории искусственного... | ||
Учебно-методическое пособие предназначено для студентов, изучающих курсы «Прикладная социология», «Статистический анализ социальной... | Инструкции dax вычисляются для находящегося в памяти хранилища реляционных данных, состоящего из таблиц и связей в книге PowerPivot.... | ||
Современные методы электронного обмена информацией на примере конфигурации «Бухгалтерский и налоговый учет», редакция 3 (управляемое... | Материалы для промежуточной аттестации по дисциплине «Современные методы исследований в естествознании» для студентов заочной формы... | ||
Программа учебной дисциплины является частью профессиональной образовательной программы переподготовки специалистов по профессии |
Поиск Главная страница   Заполнение бланков   Бланки   Договоры   Документы    |