К основному контенту

 



 niki24874@gmail.com


 Поблагодарить автора

 payeer - P1040394788


 capitalist - U10989124


 capitalist - R10989122






Что такое психологические теории?

Психологические теории — это основанные на фактах идеи, описывающие феномен человеческого поведения. Эти теории основаны на гипотезе , которая подкреплена доказательствами. Таким образом, двумя ключевыми компонентами психологической теории являются:


Он должен описывать поведение.

Он должен делать прогнозы относительно будущего поведения.

Термин «теория» используется с удивительной частотой в повседневном языке. Оно часто используется для обозначения догадки, догадки или предположения. Вы можете даже услышать, как люди отвергают определенную информацию, потому что это «всего лишь теория».


Но в сфере науки теория — это не просто догадка. Теория представляет концепцию или идею, которые можно проверить. Ученые могут проверить теорию с помощью эмпирических исследований и собрать доказательства, подтверждающие или опровергающие ее.


По мере появления новых данных и проведения дополнительных исследований теория может быть уточнена, изменена или даже отвергнута, если она не согласуется с последними научными открытиями. Общая сила научной теории зависит от ее способности объяснять разнообразные явления. 1


5 основных психологических теорий

Некоторые из наиболее известных психологических теорий основаны на взглядах различных направлений психологии . Существует пять основных типов психологических теорий.


Поведенческие теории

Поведенческая психология, также известная как бихевиоризм, представляет собой теорию обучения, основанную на идее о том, что любое поведение приобретается посредством обусловливания.


Поддерживаемые такими известными психологами, как Джон Б. Уотсон и Б. Ф. Скиннер , поведенческие теории доминировали в психологии в первой половине двадцатого века. 2 Сегодня терапевты по-прежнему широко используют поведенческие техники , чтобы помочь клиентам освоить новые навыки и модели поведения.

Когнитивные теории

Когнитивные теории психологии сосредоточены на внутренних состояниях, таких как мотивация, решение проблем, принятие решений , мышление и внимание. Такие теории стремятся объяснить различные психические процессы, в том числе то, как мозг обрабатывает информацию и как наши мысли приводят к определенным эмоциям и поведению. 3


Гуманистические теории

Теории гуманистической психологии начали набирать популярность в 1950-х годах. 4 Среди крупных теоретиков-гуманистов были Карл Роджерс и Абрахам Маслоу .


В то время как более ранние теории часто сосредотачивались на аномальном поведении и психологических проблемах, гуманистические теории поведения вместо этого подчеркивали основное добро человека.

Психодинамические теории

Психодинамические теории исследуют бессознательные концепции, которые формируют наши эмоции, отношения и личность. Психодинамические подходы стремятся понять первопричины бессознательного поведения. 5



Эти теории тесно связаны с Зигмундом Фрейдом и его последователями. Психодинамический подход просматривается во многих утверждениях Фрейда — например, что наше взрослое поведение уходит своими корнями в наш детский опыт и что личность состоит из трех частей: ИД, Эго и Супер-Эго. 6


Биологические теории

Биологические теории в психологии приписывают человеческие эмоции и поведение биологическим причинам. Например, в дебатах о человеческом поведении природа против воспитания биологическая точка зрения будет на стороне природы.


Биологические теории уходят своими корнями в идеи Чарльза Дарвина, известного своими теоретическими рассуждениями о роли эволюции и генетики в психологии.


Кто-то, исследующий психологическую проблему с биологической точки зрения, может исследовать, есть ли телесные повреждения, вызывающие определенный тип поведения, или это поведение было унаследовано. 7


Различные типы психологических теорий

Существует множество психологических теорий, но большинство из них можно отнести к одному из четырех основных типов.


Теории развития

Теории развития обеспечивают основу для размышлений о человеческом росте, развитии и обучении. Если вы когда-нибудь задумывались о том, что движет человеческим мышлением и поведением, понимание этих теорий может дать полезную информацию о людях и обществе.


Теории развития предлагают набор руководящих принципов и концепций, описывающих и объясняющих развитие человека. Некоторые теории развития сосредотачиваются на формировании определенного качества, например теория морального развития Кольберга. 8 Другие теории развития фокусируются на росте, который происходит на протяжении всей жизни, например  , теория психосоциального развития Эриксона .


Великие теории

Великие теории — это всеобъемлющие идеи, часто выдвигаемые крупными мыслителями, такими как Зигмунд Фрейд,  Эрик Эриксон 9 и  Жан Пиаже . Великие теории развития включают психоаналитическую теорию, теорию  обучения и  когнитивную теорию .


Эти теории пытаются объяснить большую часть человеческого поведения, но часто считаются устаревшими и неполными перед лицом современных исследований. Психологи и исследователи часто используют большие теории в качестве основы для исследований, но также учитывают более мелкие теории и недавние исследования.


Мини-теории

Мини-теории описывают небольшой, очень частный аспект развития. Мини-теория может объяснить относительно узкое поведение, например, то, как формируется самооценка 10 или социализация в раннем детстве. Эти теории часто коренятся в идеях, установленных великими теориями, но они не стремятся описать и объяснить поведение и рост человека в целом.


Новые теории

Эмерджентные теории — это те, которые были созданы относительно недавно. Они часто образуются путем систематического объединения различных мини-теорий. Эти теории основаны на исследованиях и идеях из разных дисциплин, но еще не так широки и далеко идущи, как великие теории. Социокультурная  теория  , предложенная Львом Выготским  , является хорошим примером эмерджентной теории развития. 11

Цель психологических теорий

Вы можете задаться вопросом, насколько необходимо изучать различные теории психологии, особенно те, которые считаются неточными или устаревшими.


Однако теории предоставляют ценную информацию об истории психологии и развитии мысли по конкретной теме. Они также позволяют глубже понять современные теории. Каждый из них помогает внести свой вклад в наши знания о человеческом разуме и поведении.


Поняв, как развивалось мышление, вы сможете лучше понять не только то, где была психология, но и то, куда она может двигаться в будущем.


Изучение научных теорий может улучшить ваше понимание того, как научные объяснения поведения и других явлений в мире природы формируются, исследуются и принимаются научным сообществом.


В то время как продолжают бушевать дебаты по горячим темам, стоит изучать науку и психологические теории, возникшие в результате таких исследований, даже если то, что часто раскрывается, может оказаться суровой или неудобной правдой.


Как однажды написал Карл Саган: «Гораздо лучше понять вселенную такой, какая она есть на самом деле, чем упорствовать в иллюзиях, какими бы удовлетворительными и обнадеживающими они ни были». 12

Примеры психологических теорий

Вот несколько примеров психологических теорий, которые сохраняют актуальность даже сегодня.


Иерархия потребностей Маслоу

Теория иерархии потребностей Маслоу обычно представлена ​​​​пирамидой, в которой перечислены пять различных типов человеческих потребностей. Этими потребностями снизу вверх являются:


Физиологические : пища, вода, убежище.

Потребности в безопасности : Безопасность, ресурсы

Принадлежность и любовь : Интимные отношения

Потребность в уважении : чувство выполненного долга.

Самореализация : реализовать свой полный потенциал творчески и духовно.

Согласно Маслоу, эти потребности представляют собой то, что нужно людям, чтобы чувствовать себя удовлетворенными и вести продуктивную жизнь. Однако удовлетворять эти потребности нужно снизу вверх, по Маслоу.


Например, самые основные и самые насущные потребности являются физиологическими. Как только они будут удовлетворены, вы можете сосредоточиться на последующих потребностях, таких как отношения и самооценка. 13


Теория когнитивного развития Пиаже

Теория когнитивного развития Пиаже фокусируется на том, как дети учатся и развиваются в своем понимании окружающего мира. Согласно его теории, в процессе когнитивного развития дети проходят четыре стадии:


Сенсомоторная стадия : эта стадия длится от рождения до двухлетнего возраста. Младенцы и дети младшего возраста узнают об окружающем мире с помощью рефлексов, своих пяти чувств и двигательных реакций.

Предоперационная стадия : Эта стадия происходит в возрасте от двух до семи лет. Дети начинают учиться мыслить символически, но им трудно понять точку зрения других.

Конкретный операционный этап : этот этап длится от семи до 11 лет. Дети начинают мыслить логически и способны рассуждать на основе конкретной информации, чтобы сформировать общий принцип.

Стадия формальной эксплуатации : Эта стадия начинается в возрасте 12 лет и продолжается с этого момента. Это когда мы начинаем мыслить абстрактно, например, размышляя о моральных, философских и политических проблемах. 14

Психоаналитическая теория Фрейда

До сих пор широко обсуждается знаменитая психоаналитическая теория Фрейда . В своей теории Фрейд предположил, что человеческая личность состоит из ид, эго и суперэго. 15


Ид, по Фрейду, является первичным компонентом личности. Оно бессознательно и желает удовольствия и немедленного удовлетворения. Например, младенец, плачущий, потому что он голоден, является примером работы Ид. Чтобы удовлетворить свои потребности, они реагируют на голод плачем.


Эго отвечает за управление импульсами Ид, чтобы они соответствовали нормам внешнего мира. С возрастом ваше эго развивается.


Например, будучи взрослым, вы знаете, что плач не привлекает к вам такого же внимания и заботы, как в младенчестве. Таким образом, эго управляет первичными импульсами Ид, следя за тем, чтобы ваши ответы соответствовали времени и месту.


Суперэго состоит из того, что мы усваиваем, чтобы быть правильными и неправильными, основываясь на том, чему нас учили (наша совесть является частью суперэго). Суперэго работает над тем, чтобы сделать наше поведение приемлемым, и побуждает эго принимать решения, основанные на идеализме (нереалистичности). 15


Слово из Веривелла

Многое из того, что мы знаем о человеческом мышлении и поведении, появилось благодаря различным теориям психологии. Например, поведенческие теории продемонстрировали, как можно использовать обусловливание для содействия обучению. Узнав больше об этих теориях, вы сможете глубже и глубже понять прошлое, настоящее и будущее психологии.








Определение личности

В то время как личность — это то, о чем мы говорим все время («У него такой замечательный характер!» или «Ее личность идеально подходит для этой работы!»), вы можете быть удивлены, узнав, что психологи не всегда согласны с одним определением. того, что именно составляет личность.


Личность в широком смысле описывается как характерные модели мыслей, чувств и поведения, которые делают человека уникальным. Проще говоря, это то, что делает вас вами.


Исследователи обнаружили, что хотя некоторые внешние факторы могут влиять на выражение определенных черт, личность зарождается внутри человека. 1 Хотя некоторые аспекты личности могут меняться по мере взросления, личность также имеет тенденцию оставаться довольно неизменной на протяжении всей жизни.


Поскольку личность играет такую ​​важную роль в человеческом поведении, изучению этой увлекательной темы посвящена целая отрасль психологии . Психологи личности интересуются уникальными характеристиками людей, а также сходствами между группами людей.


 10 увлекательных фактов о личности

Характеристики личности

Чтобы понять психологию личности, важно изучить некоторые ключевые характеристики того, как работает личность. 1


Личность организована и последовательна. Мы склонны выражать определенные аспекты нашей личности в различных ситуациях, и наши реакции обычно стабильны. 

Хотя личность в целом стабильна, на нее может влиять окружающая среда.  Например, в то время как ваш характер может привести к тому, что вы будете застенчивы в социальных ситуациях, чрезвычайная ситуация может привести к тому, что вы будете вести себя более откровенно и брать на себя ответственность.

Личность вызывает поведение. Вы реагируете на людей и предметы в вашем окружении в зависимости от вашей личности. От ваших личных предпочтений до выбора карьеры каждый аспект вашей жизни зависит от вашей личности.

 Как личность влияет на физическое и психическое здоровье

Исследовательские модели в психологии личности

Теперь, когда вы знаете немного больше об основах личности, пришло время поближе взглянуть на то, как ученые на самом деле изучают человеческую личность. Существуют различные методики, которые используются при изучении личности. Каждая техника имеет свои сильные и слабые стороны.


Экспериментальные методы - это те, в которых исследователь контролирует и манипулирует интересующими переменными и измеряет результаты. Это наиболее научная форма исследования, но экспериментальное исследование может быть затруднено при изучении таких аспектов личности, как мотивация , эмоции и побуждения. Эти идеи являются внутренними, абстрактными, и их может быть трудно измерить. Экспериментальный метод позволяет исследователям изучить причинно-следственные связи между различными интересующими переменными.

Тематические исследования и методы самоотчета включают в себя углубленный анализ человека, а также информацию, предоставленную человеком. Тематические исследования в значительной степени зависят от интерпретации наблюдателя, в то время как методы самоотчета зависят от памяти интересующего человека. Из-за этого эти методы, как правило, очень субъективны, и их трудно обобщить на большую популяцию.

Клинические исследования основаны на информации, полученной от клинических пациентов в течение курса лечения. Многие теории личности основаны на этом типе исследований, но поскольку объекты исследования уникальны и демонстрируют ненормальное поведение, это исследование, как правило, очень субъективно и его трудно обобщать.

Важная терминология психологии личности

Классическое кондиционирование

Классическое обусловливание — это метод обучения поведению, который начинается с естественного стимула, вызывающего автоматическую реакцию. Затем ранее нейтральный стимул сочетается с естественным стимулом.


В конце концов, ранее нейтральный стимул вызывает реакцию без присутствия естественного стимула. Эти два элемента известны как  условный раздражитель  и  условная реакция .


Оперантного кондиционирования

Оперантное обусловливание — это техника обучения поведению, в которой используются подкрепления или наказания для воздействия на поведение. Связь устанавливается между поведением и следствием этого поведения.


Бессознательный

В психоаналитической теории личности Фрейда бессознательное является резервуаром чувств, мыслей, побуждений и воспоминаний, которые находятся за пределами нашего сознательного понимания. Большая часть содержимого бессознательного неприемлема или неприятна, например, чувство боли, тревоги или конфликта.


Согласно Фрейду, бессознательное продолжает влиять на наше поведение и переживания, даже если мы не осознаем этих глубинных влияний. 2


Идентификатор

Согласно психоаналитической теории личности Фрейда, Ид — это компонент личности, состоящий из бессознательной психической энергии, которая работает на удовлетворение основных побуждений, потребностей и желаний. Ид действует на основе  принципа удовольствия , который требует немедленного удовлетворения потребностей.


Эго

Согласно Фрейду, эго — это в значительной степени бессознательная часть личности, которая опосредует требования Ид, Суперэго и реальности. Эго мешает нам действовать в соответствии с нашими основными побуждениями (созданными Ид), но также работает для достижения баланса с нашими моральными и идеалистическими стандартами (созданными Суперэго).


Суперэго

Суперэго — это компонент личности, состоящий из наших внутренних идеалов, которые мы приобрели от наших родителей и от общества. Суперэго работает, чтобы подавить побуждения Ид и пытается заставить эго вести себя нравственно, а не реалистично.


Основные теории психологии личности

Психология личности находится в центре внимания некоторых из самых известных психологических теорий ряда известных мыслителей, включая Зигмунда Фрейда и Эрика Эриксона. Некоторые из этих теорий пытаются рассматривать конкретную область личности, в то время как другие пытаются объяснить личность гораздо шире.


Биологические теории

Биологические подходы предполагают, что генетика отвечает за личность. В классическом споре о природе и воспитании биологические теории личности на стороне природы.


Исследования наследуемости показывают, что существует связь между генетикой и личностными чертами. 3  Исследования близнецов часто используются для изучения того, какие черты могут быть связаны с генетикой, а какие могут быть связаны с переменными окружающей среды. Например, исследователи могут изучить различия и сходства в характерах близнецов, воспитанных вместе, и тех, кто вырос порознь.


Одним из самых известных биологических теоретиков был  Ганс Айзенк , который связал аспекты личности с биологическими процессами.


Айзенк утверждал, что на личность влияет гормон стресса кортизол. Согласно его теории,  у интровертов сильное  корковое возбуждение, и они избегают стимуляции, в то время как  у экстравертов  корковое возбуждение низкое, и они жаждут стимуляции. 4


Поведенческие теории

Поведенческие теоретики включают  Б. Ф. Скиннера  и  Джона Б. Уотсона . Поведенческие теории предполагают, что личность является результатом взаимодействия между человеком и окружающей средой. 5 Теоретики поведения изучают наблюдаемое и измеримое поведение, отвергая теории, которые принимают участие во внутренних мыслях, настроениях и чувствах, поскольку они не могут быть измерены.


Согласно теоретикам поведения, обусловленность (предсказуемые поведенческие реакции) возникает в результате взаимодействия с окружающей средой, которая в конечном итоге формирует нашу личность.


Психодинамические теории

Психодинамические теории личности находятся под сильным влиянием работ  Зигмунда Фрейда  и подчеркивают влияние бессознательного и детских переживаний на личность. 6  Психодинамические теории включают  теорию психосексуальной стадии Зигмунда Фрейда и стадии психосоциального развития  Эрика Эриксона  .


Фрейд считал, что тремя компонентами личности являются ид, эго и суперэго. Ид отвечает за потребности и побуждения, а Суперэго регулирует идеалы и мораль. Эго, в свою очередь, смягчает требования Ид, Суперэго и реальности.


Фрейд предположил, что дети проходят ряд стадий, на которых энергия Ид фокусируется на разных эрогенных зонах.


Эриксон также считал, что личность проходит ряд стадий, на каждой из которых возникают определенные конфликты. Успех на любом этапе зависит от успешного преодоления этих конфликтов.


Гуманистические теории

Гуманистические теории подчеркивают важность свободы воли и индивидуального опыта в развитии личности. Среди теоретиков  -гуманистов Карл Роджерс и Абрахам Маслоу.


Теоретики-гуманисты продвигают концепцию самореализации , которая представляет собой врожденную потребность в личном росте и то, как личный рост мотивирует поведение.


Теории черт

Подход  , основанный на теории черт,  является одним из самых выдающихся направлений в психологии личности. Согласно этим теориям, личность состоит из ряда широких черт. Черта – это относительно устойчивая характеристика, которая заставляет человека вести себя определенным образом. По сути, это психологический «план», который формирует поведенческие паттерны.


Некоторые из самых известных теорий черт включают трехмерную теорию Айзенка и  пятифакторную теорию  личности.


Айзенк использовал личностные опросники для сбора данных от участников, а затем применил статистический метод, известный как факторный анализ, для анализа результатов. Айзенк пришел к выводу, что существует три основных измерения личности: экстраверсия, невротизм и психотизм. 8


Айзенк считал, что эти измерения затем по-разному комбинируются, чтобы сформировать уникальную личность человека. Позже Айзенк добавил третье измерение, известное как психотизм, которое связано с такими вещами, как агрессия, эмпатия и общительность.


Более поздние исследователи предположили, что существует пять основных аспектов, составляющих личность человека, которые часто называют теорией личности Большой пятерки.


Теория «Большой пятерки» предполагает, что всех личностей можно охарактеризовать пятью основными личностными параметрами: открытость, добросовестность, экстраверсия, покладистость и невротизм, которые в совокупности обозначаются аббревиатурой ОКЕАН. 9


Известные деятели психологии личности

Некоторые из самых известных фигур в истории психологии оставили неизгладимый след в области личности. Чтобы лучше понять различные теории личности, полезно узнать больше о жизни, теориях и вкладе в психологию этих выдающихся психологов. 10


Зигмунд Фрейд

Зигмунд Фрейд (1856-1939) был основоположником психоаналитической теории. Его теории подчеркивали важность бессознательного, детских переживаний, снов и символики. Его теория психосексуального развития предполагала, что дети проходят через ряд стадий, во время которых либидинозная энергия фокусируется на разных частях тела.


Его идеи известны как великие теории, потому что они пытаются объяснить практически каждый аспект человеческого поведения. Некоторые идеи Фрейда считаются современными психологами устаревшими, но он оказал большое влияние на курс психологии, а некоторые концепции, такие как полезность разговорной терапии и важность бессознательного, сохранились.


Эрик Эриксон

Эрик Эриксон  (1902–1994) был эго-психологом, обученным  Анной Фрейд . Его теория психосоциальных стадий описывает, как личность развивается на протяжении всей жизни. Как и у Фрейда, современные исследователи считают некоторые аспекты теории Эриксона устаревшими, но его теория восьми стадий развития остается популярной и влиятельной.


Б. Ф. Скиннер

Б. Ф. Скиннер (1904–1990) был бихевиористом, известным прежде всего своими исследованиями  оперантного обусловливания  и открытием  графиков подкрепления . Графики подкрепления влияют на то, как быстро усваивается поведение, и на силу реакции.


Расписания, описанные Скиннером, представляют собой расписания с фиксированным соотношением, расписания с фиксированной переменной, расписания с переменным соотношением и расписания с переменным интервалом .


Сандра Бем

Сандра Бем (1944–2014) оказала большое влияние на психологию и на наше понимание половых ролей, пола и сексуальности. Она разработала свою теорию гендерной схемы, чтобы объяснить, как общество и культура передают представления о сексе и гендере. Гендерные схемы, как предположил Бем, были сформированы такими вещами, как воспитание детей, школа, средства массовой информации и другие культурные влияния. 


Авраам Маслоу

Абрахам Маслоу  (1908-1970) был психологом-гуманистом, разработавшим известную  иерархию потребностей . Иерархия включает в себя физиологические потребности, потребности в безопасности и защищенности, потребности в любви и привязанности, потребности в самоуважении и потребности в самоактуализации.


Карл Роджерс

Карл Роджерс  (1902–1987) был психологом-гуманистом, который считал, что у всех людей есть  тенденция к актуализации  — стремление реализовать индивидуальный потенциал, который мотивирует поведение. Роджерс назвал здоровых людей  полностью функционирующими , описывая этих людей как тех, кто открыт опыту, живет настоящим моментом, доверяет своим суждениям, чувствует себя свободным и креативен.


Слово из Веривелла

Личность делает нас теми, кто мы есть, поэтому неудивительно, почему она была источником такого увлечения как в науке, так и в повседневной жизни. Различные теории личности, предложенные разными психологами, помогли нам глубже и глубже понять, что делает каждого человека уникальным.


Узнав больше об этих теориях, вы сможете лучше понять, как исследователи пришли к познанию психологии личности, а также рассмотреть вопросы, которые могут возникнуть в будущих исследованиях.







Определение личности

В то время как личность — это то, о чем мы говорим все время («У него такой замечательный характер!» или «Ее личность идеально подходит для этой работы!»), вы можете быть удивлены, узнав, что психологи не всегда согласны с одним определением. того, что именно составляет личность.


Личность в широком смысле описывается как характерные модели мыслей, чувств и поведения, которые делают человека уникальным. Проще говоря, это то, что делает вас вами.


Исследователи обнаружили, что хотя некоторые внешние факторы могут влиять на выражение определенных черт, личность зарождается внутри человека. 1 Хотя некоторые аспекты личности могут меняться по мере взросления, личность также имеет тенденцию оставаться довольно неизменной на протяжении всей жизни.


Поскольку личность играет такую ​​важную роль в человеческом поведении, изучению этой увлекательной темы посвящена целая отрасль психологии . Психологи личности интересуются уникальными характеристиками людей, а также сходствами между группами людей.


 10 увлекательных фактов о личности

Характеристики личности

Чтобы понять психологию личности, важно изучить некоторые ключевые характеристики того, как работает личность. 1


Личность организована и последовательна. Мы склонны выражать определенные аспекты нашей личности в различных ситуациях, и наши реакции обычно стабильны. 

Хотя личность в целом стабильна, на нее может влиять окружающая среда.  Например, в то время как ваш характер может привести к тому, что вы будете застенчивы в социальных ситуациях, чрезвычайная ситуация может привести к тому, что вы будете вести себя более откровенно и брать на себя ответственность.

Личность вызывает поведение. Вы реагируете на людей и предметы в вашем окружении в зависимости от вашей личности. От ваших личных предпочтений до выбора карьеры каждый аспект вашей жизни зависит от вашей личности.

 Как личность влияет на физическое и психическое здоровье

Исследовательские модели в психологии личности

Теперь, когда вы знаете немного больше об основах личности, пришло время поближе взглянуть на то, как ученые на самом деле изучают человеческую личность. Существуют различные методики, которые используются при изучении личности. Каждая техника имеет свои сильные и слабые стороны.


Экспериментальные методы - это те, в которых исследователь контролирует и манипулирует интересующими переменными и измеряет результаты. Это наиболее научная форма исследования, но экспериментальное исследование может быть затруднено при изучении таких аспектов личности, как мотивация , эмоции и побуждения. Эти идеи являются внутренними, абстрактными, и их может быть трудно измерить. Экспериментальный метод позволяет исследователям изучить причинно-следственные связи между различными интересующими переменными.

Тематические исследования и методы самоотчета включают в себя углубленный анализ человека, а также информацию, предоставленную человеком. Тематические исследования в значительной степени зависят от интерпретации наблюдателя, в то время как методы самоотчета зависят от памяти интересующего человека. Из-за этого эти методы, как правило, очень субъективны, и их трудно обобщить на большую популяцию.

Клинические исследования основаны на информации, полученной от клинических пациентов в течение курса лечения. Многие теории личности основаны на этом типе исследований, но поскольку объекты исследования уникальны и демонстрируют ненормальное поведение, это исследование, как правило, очень субъективно и его трудно обобщать.

Важная терминология психологии личности

Классическое кондиционирование

Классическое обусловливание — это метод обучения поведению, который начинается с естественного стимула, вызывающего автоматическую реакцию. Затем ранее нейтральный стимул сочетается с естественным стимулом.


В конце концов, ранее нейтральный стимул вызывает реакцию без присутствия естественного стимула. Эти два элемента известны как  условный раздражитель  и  условная реакция .


Оперантного кондиционирования

Оперантное обусловливание — это техника обучения поведению, в которой используются подкрепления или наказания для воздействия на поведение. Связь устанавливается между поведением и следствием этого поведения.


Бессознательный

В психоаналитической теории личности Фрейда бессознательное является резервуаром чувств, мыслей, побуждений и воспоминаний, которые находятся за пределами нашего сознательного понимания. Большая часть содержимого бессознательного неприемлема или неприятна, например, чувство боли, тревоги или конфликта.


Согласно Фрейду, бессознательное продолжает влиять на наше поведение и переживания, даже если мы не осознаем этих глубинных влияний. 2


Идентификатор

Согласно психоаналитической теории личности Фрейда, Ид — это компонент личности, состоящий из бессознательной психической энергии, которая работает на удовлетворение основных побуждений, потребностей и желаний. Ид действует на основе  принципа удовольствия , который требует немедленного удовлетворения потребностей.


Эго

Согласно Фрейду, эго — это в значительной степени бессознательная часть личности, которая опосредует требования Ид, Суперэго и реальности. Эго мешает нам действовать в соответствии с нашими основными побуждениями (созданными Ид), но также работает для достижения баланса с нашими моральными и идеалистическими стандартами (созданными Суперэго).


Суперэго

Суперэго — это компонент личности, состоящий из наших внутренних идеалов, которые мы приобрели от наших родителей и от общества. Суперэго работает, чтобы подавить побуждения Ид и пытается заставить эго вести себя нравственно, а не реалистично.


Основные теории психологии личности

Психология личности находится в центре внимания некоторых из самых известных психологических теорий ряда известных мыслителей, включая Зигмунда Фрейда и Эрика Эриксона. Некоторые из этих теорий пытаются рассматривать конкретную область личности, в то время как другие пытаются объяснить личность гораздо шире.


Биологические теории

Биологические подходы предполагают, что генетика отвечает за личность. В классическом споре о природе и воспитании биологические теории личности на стороне природы.


Исследования наследуемости показывают, что существует связь между генетикой и личностными чертами. 3  Исследования близнецов часто используются для изучения того, какие черты могут быть связаны с генетикой, а какие могут быть связаны с переменными окружающей среды. Например, исследователи могут изучить различия и сходства в характерах близнецов, воспитанных вместе, и тех, кто вырос порознь.


Одним из самых известных биологических теоретиков был  Ганс Айзенк , который связал аспекты личности с биологическими процессами.


Айзенк утверждал, что на личность влияет гормон стресса кортизол. Согласно его теории,  у интровертов сильное  корковое возбуждение, и они избегают стимуляции, в то время как  у экстравертов  корковое возбуждение низкое, и они жаждут стимуляции. 4


Поведенческие теории

Поведенческие теоретики включают  Б. Ф. Скиннера  и  Джона Б. Уотсона . Поведенческие теории предполагают, что личность является результатом взаимодействия между человеком и окружающей средой. 5 Теоретики поведения изучают наблюдаемое и измеримое поведение, отвергая теории, которые принимают участие во внутренних мыслях, настроениях и чувствах, поскольку они не могут быть измерены.


Согласно теоретикам поведения, обусловленность (предсказуемые поведенческие реакции) возникает в результате взаимодействия с окружающей средой, которая в конечном итоге формирует нашу личность.


Психодинамические теории

Психодинамические теории личности находятся под сильным влиянием работ  Зигмунда Фрейда  и подчеркивают влияние бессознательного и детских переживаний на личность. 6  Психодинамические теории включают  теорию психосексуальной стадии Зигмунда Фрейда и стадии психосоциального развития  Эрика Эриксона  .


Фрейд считал, что тремя компонентами личности являются ид, эго и суперэго. Ид отвечает за потребности и побуждения, а Суперэго регулирует идеалы и мораль. Эго, в свою очередь, смягчает требования Ид, Суперэго и реальности.


Фрейд предположил, что дети проходят ряд стадий, на которых энергия Ид фокусируется на разных эрогенных зонах.


Эриксон также считал, что личность проходит ряд стадий, на каждой из которых возникают определенные конфликты. Успех на любом этапе зависит от успешного преодоления этих конфликтов.


Гуманистические теории

Гуманистические теории подчеркивают важность свободы воли и индивидуального опыта в развитии личности. Среди теоретиков  -гуманистов Карл Роджерс и Абрахам Маслоу.


Теоретики-гуманисты продвигают концепцию самореализации , которая представляет собой врожденную потребность в личном росте и то, как личный рост мотивирует поведение.


Теории черт

Подход  , основанный на теории черт,  является одним из самых выдающихся направлений в психологии личности. Согласно этим теориям, личность состоит из ряда широких черт. Черта – это относительно устойчивая характеристика, которая заставляет человека вести себя определенным образом. По сути, это психологический «план», который формирует поведенческие паттерны.


Некоторые из самых известных теорий черт включают трехмерную теорию Айзенка и  пятифакторную теорию  личности.


Айзенк использовал личностные опросники для сбора данных от участников, а затем применил статистический метод, известный как факторный анализ, для анализа результатов. Айзенк пришел к выводу, что существует три основных измерения личности: экстраверсия, невротизм и психотизм. 8


Айзенк считал, что эти измерения затем по-разному комбинируются, чтобы сформировать уникальную личность человека. Позже Айзенк добавил третье измерение, известное как психотизм, которое связано с такими вещами, как агрессия, эмпатия и общительность.


Более поздние исследователи предположили, что существует пять основных аспектов, составляющих личность человека, которые часто называют теорией личности Большой пятерки.


Теория «Большой пятерки» предполагает, что всех личностей можно охарактеризовать пятью основными личностными параметрами: открытость, добросовестность, экстраверсия, покладистость и невротизм, которые в совокупности обозначаются аббревиатурой ОКЕАН. 9


Известные деятели психологии личности

Некоторые из самых известных фигур в истории психологии оставили неизгладимый след в области личности. Чтобы лучше понять различные теории личности, полезно узнать больше о жизни, теориях и вкладе в психологию этих выдающихся психологов. 10


Зигмунд Фрейд

Зигмунд Фрейд (1856-1939) был основоположником психоаналитической теории. Его теории подчеркивали важность бессознательного, детских переживаний, снов и символики. Его теория психосексуального развития предполагала, что дети проходят через ряд стадий, во время которых либидинозная энергия фокусируется на разных частях тела.


Его идеи известны как великие теории, потому что они пытаются объяснить практически каждый аспект человеческого поведения. Некоторые идеи Фрейда считаются современными психологами устаревшими, но он оказал большое влияние на курс психологии, а некоторые концепции, такие как полезность разговорной терапии и важность бессознательного, сохранились.


Эрик Эриксон

Эрик Эриксон  (1902–1994) был эго-психологом, обученным  Анной Фрейд . Его теория психосоциальных стадий описывает, как личность развивается на протяжении всей жизни. Как и у Фрейда, современные исследователи считают некоторые аспекты теории Эриксона устаревшими, но его теория восьми стадий развития остается популярной и влиятельной.


Б. Ф. Скиннер

Б. Ф. Скиннер (1904–1990) был бихевиористом, известным прежде всего своими исследованиями  оперантного обусловливания  и открытием  графиков подкрепления . Графики подкрепления влияют на то, как быстро усваивается поведение, и на силу реакции.


Расписания, описанные Скиннером, представляют собой расписания с фиксированным соотношением, расписания с фиксированной переменной, расписания с переменным соотношением и расписания с переменным интервалом .


Сандра Бем

Сандра Бем (1944–2014) оказала большое влияние на психологию и на наше понимание половых ролей, пола и сексуальности. Она разработала свою теорию гендерной схемы, чтобы объяснить, как общество и культура передают представления о сексе и гендере. Гендерные схемы, как предположил Бем, были сформированы такими вещами, как воспитание детей, школа, средства массовой информации и другие культурные влияния. 


Авраам Маслоу

Абрахам Маслоу  (1908-1970) был психологом-гуманистом, разработавшим известную  иерархию потребностей . Иерархия включает в себя физиологические потребности, потребности в безопасности и защищенности, потребности в любви и привязанности, потребности в самоуважении и потребности в самоактуализации.


Карл Роджерс

Карл Роджерс  (1902–1987) был психологом-гуманистом, который считал, что у всех людей есть  тенденция к актуализации  — стремление реализовать индивидуальный потенциал, который мотивирует поведение. Роджерс назвал здоровых людей  полностью функционирующими , описывая этих людей как тех, кто открыт опыту, живет настоящим моментом, доверяет своим суждениям, чувствует себя свободным и креативен.


Слово из Веривелла

Личность делает нас теми, кто мы есть, поэтому неудивительно, почему она была источником такого увлечения как в науке, так и в повседневной жизни. Различные теории личности, предложенные разными психологами, помогли нам глубже и глубже понять, что делает каждого человека уникальным.


Узнав больше об этих теориях, вы сможете лучше понять, как исследователи пришли к познанию психологии личности, а также рассмотреть вопросы, которые могут возникнуть в будущих исследованиях.









Обзор теорий Зигмунда Фрейда

 

Зигмунд Фрейд

 


Теория Зигмунда Фрейда предполагает, что на человеческое поведение влияют бессознательные воспоминания, мысли и побуждения. Эта теория также предполагает, что психика состоит из трех аспектов: ид, эго и суперэго. Ид совершенно бессознательно, в то время как эго действует в сознательном уме. Суперэго действует как бессознательно, так и сознательно.


Студенты-психологи тратят немало времени на изучение теории Фрейда. Даже те, кто вне психологии , часто имеют некоторое представление о фрейдистском психоанализе, школе мысли, созданной Зигмундом Фрейдом.


Зная больше о психологии Фрейда, а также о ключевых концепциях психоанализа, таких как бессознательное, фиксации, защитные механизмы и символы сновидений, вы сможете понять влияние теорий Фрейда на современных психологов .




Ключевые теории Зигмунда Фрейда

В этом кратком обзоре теории Фрейда вы узнаете больше о некоторых основных идеях, предложенных Зигмундом Фрейдом.


Разговорная терапия

Одним из величайших вкладов Фрейда в психологию была разговорная терапия , представление о том, что простой разговор о проблемах может помочь облегчить их. Именно благодаря общению со своим близким другом и коллегой Йозефом Брейером Фрейд узнал о женщине, известной в истории болезни как Анна О.


Настоящее имя молодой женщины было Берта Паппенгейм. 1 Она стала пациенткой Брейера после приступа того, что тогда было известно как истерия . Симптомы включали помутнение зрения, галлюцинации и частичный паралич.


Брейер заметил, что обсуждение ее переживаний принесло некоторое облегчение ее симптомам. Сама Паппенгейм начала называть это лечение «разговорным лечением». 2


Хотя Анну О. часто называют одной из пациенток Фрейда, на самом деле они никогда не встречались. Однако Фрейд часто обсуждал ее случай с Брейером, и они вместе работали над книгой 1895 года, основанной на ее лечении, под названием « Исследования истерии» .


Фрейд пришел к выводу, что ее истерия была результатом сексуального насилия в детстве , что в конечном итоге привело к разрыву в профессиональных и личных отношениях Фрейда и Брейера. Анна О., возможно, на самом деле не была пациенткой Фрейда, но ее случай во многом повлиял на работу Фрейда и более поздние теории терапии и психоанализа .


Движущие силы личности

Согласно теории Фрейда, существует несколько различных факторов, влияющих на личность. К ним относятся катексис и антикатексис, а также инстинкты жизни и смерти.


Катексис и антикатексис


Согласно психоаналитической теории Фрейда, вся психическая энергия порождается либидо . Фрейд предположил, что на наши психические состояния влияют две конкурирующие силы: катексис и антикатексис. .


Катексис описывался как вложение психической энергии в человека, идею или объект. 4 Если вы, например, голодны, вы можете создать мысленный образ вкусной еды, которой вам так хотелось.


В других случаях эго может использовать некоторую энергию Ид (примитивного ума) для поиска действий, связанных с желанием, чтобы рассеять избыточную энергию Ид. Придерживаясь того же примера, если вы на самом деле не можете найти еду, чтобы утолить голод, вы можете вместо этого полистать кулинарную книгу или просмотреть свой любимый блог рецептов.


Антикатексис предполагает, что Эго блокирует социально неприемлемые потребности Ид. Подавление побуждений и желаний — одна из распространенных форм антикатексиса, но это требует значительных затрат энергии.


Согласно теории Фрейда, доступно ограниченное количество либидинозной энергии. Когда много энергии тратится на подавление побуждений посредством антикатексиса, на другие процессы остается меньше энергии.


Инстинкты жизни и инстинкты смерти


Фрейд также считал, что большая часть человеческого поведения мотивирована двумя движущими инстинктами: инстинктами жизни и инстинктами смерти . Инстинкты жизни (Эрос) связаны с основной потребностью в выживании, размножении и удовольствии. К ним относятся такие вещи, как потребность в еде, крове, любви и сексе.


Фрейд также предположил, что у всех людей есть бессознательное желание смерти, которое он назвал инстинктом смерти (Танатос). 5 Саморазрушительное поведение, по его мнению, было одним из проявлений влечения к смерти. Однако он считал, что эти инстинкты смерти в значительной степени сдерживаются инстинктами жизни.


Психея

Согласно теории Фрейда, человеческий разум состоит из двух основных частей: сознательного и бессознательного . Сознательный ум включает в себя все, что мы осознаем или можем легко осознать. С другой стороны, бессознательный разум включает в себя все, что находится за пределами нашего осознания, — все желания, желания, надежды, побуждения и воспоминания, о которых мы не знаем, но которые продолжают влиять на поведение.


Психология Фрейда сравнивает разум с айсбергом. Верхушка айсберга, которая на самом деле видна над водой, представляет собой лишь крошечную часть разума, в то время как огромное пространство льда, скрытое под водой, представляет гораздо большее бессознательное.


Есть некоторый вопрос относительно того, исходила ли метафора айсберга от самого Фрейда или от одного из его биографов, поскольку некоторые исследователи указывают, что в трудах Фрейда не было упоминания об айсберге. 6


В дополнение к этим двум основным компонентам разума теория Фрейда также делит человеческую личность на три основных компонента: Ид, Эго и Супер-Эго .


Идентификатор — самая примитивная часть личности, которая является источником всех наших самых основных побуждений. Оно полностью бессознательно и служит источником всей либидинозной энергии.

Эго — это компонент личности, который имеет дело с реальностью и помогает гарантировать, что требования Ид удовлетворяются реалистичными, безопасными и социально приемлемыми способами.

Суперэго — это часть личности, которая поддерживает все внутренние моральные нормы и стандарты, которые мы получаем от наших родителей, семьи и общества в целом.

Психосексуальное развитие

Теория Фрейда предполагает, что по мере развития дети проходят ряд психосексуальных стадий . На каждом этапе энергия либидо, стремящаяся к удовольствиям, фокусируется на разных частях тела.


Пять стадий психосексуального развития: 7 .


Оральный этап : либидинозные энергии сосредоточены во рту.

Анальный этап : либидинозные энергии фокусируются на анусе.

Фаллическая стадия : либидинозные энергии сосредоточены на половом члене или клиторе.

Скрытая стадия : период спокойствия, когда присутствует небольшой либидинозный интерес.

Стадия гениталий : Энергии либидо сосредоточены на гениталиях.

Успешное завершение каждого этапа приводит к здоровой личности во взрослом возрасте. Однако если конфликт остается неразрешенным на какой-либо конкретной стадии, индивидуум может остаться зацикленным или застрять на этой конкретной точке развития.


Фиксация может включать в себя чрезмерную зависимость или одержимость чем-то, связанным с этой фазой развития. Например, считается, что человек с «оральной фиксацией» застрял на оральной стадии развития. Признаки оральной фиксации могут включать чрезмерную зависимость от орального поведения, такого как курение, кусание ногтей или прием пищи. 8


Анализ сна

Бессознательное играло решающую роль во всех теориях Фрейда, и он считал сны одним из ключевых способов заглянуть в то, что лежит за пределами нашего сознательного понимания.


Он назвал сны «царской дорогой в бессознательное» 9 и считал, что, исследуя сны, он может увидеть не только то, как работает бессознательное, но и то, что оно пытается скрыть от сознания.


Фрейд считал, что содержание снов можно разделить на два разных типа:


Явное содержание сна включало в себя все действительное содержание сна — события, образы и мысли, содержащиеся в сновидении. Проявленное содержание — это, по сути, то, что спящий помнит после пробуждения.

С другой стороны, скрытое содержание — это все скрытые и символические значения сновидения. Фрейд считал, что сны — это, по сути, форма исполнения желаний. Принимая бессознательные мысли, чувства и желания и преобразовывая их в менее опасные формы, люди могут уменьшить тревогу эго.

Фрейд часто использовал анализ сновидений как отправную точку в своей технике свободных ассоциаций. Работая с клиентом, он фокусировался на определенном символе сна, а затем использовал свободные ассоциации, чтобы увидеть, какие другие мысли и образы сразу же пришли в голову клиенту.


Защитные механизмы

Даже если вы никогда раньше не изучали теории Фрейда, вы, вероятно, слышали термин «защитные механизмы». Когда кто-то, кажется, не хочет смотреть в лицо горькой правде, вы можете обвинить его в том, что он « отрицает ». Если они попытаются найти логическое объяснение неприемлемому поведению, вы можете предположить, что они «рационализируют».


Например, рационализация курения может включать «одна сигарета мне не повредит» или «если я брошу курить, я просто наберу вес».


Отрицание и рационализация представляют собой различные типы защитных механизмов или тактик, которые эго использует, чтобы защитить себя от беспокойства. Некоторые из наиболее известных механизмов защиты включают отрицание, подавление и регрессию , но их гораздо больше.


 Общие защитные механизмы, которые используют люди

Современные взгляды

Хотя теории Фрейда подвергались широкой критике, важно помнить, что его работы внесли важный вклад в психологию. Это привело к серьезным изменениям в том, как мы относимся к психическим заболеваниям , поскольку предположило, что не все психологические проблемы имеют физиологические причины.


Вера Фрейда в то, что психические проблемы можно решить, если поговорить о них, помогла революционизировать психотерапию.


Многие современные психологи не доверяют идеям Фрейда, но теории остаются важными. И исследования подтвердили эффективность различных форм разговорной терапии, например, одно из них показало, что психодинамическая терапия и когнитивно-поведенческая терапия были эффективны для лечения тревоги у студентов студенческого возраста. 10


Слово из Веривелла

Чтобы понять, где сегодня психология, важно взглянуть на то, где мы были и как мы сюда попали. Работа Фрейда дает представление о важном движении в психологии, которое помогло изменить наши представления о психическом здоровье и наш подход к психологическим расстройствам .


Изучая теории Фрейда и его последователей, вы сможете лучше понять увлекательную историю психологии. Многие термины, такие как защитный механизм , оговорка по Фрейду и анальный ретентив , стали частью нашего повседневного языка. Узнав о его работах и ​​теориях, вы сможете понять, как эти идеи и концепции вплелись в ткань популярной культуры.














Основные школы мысли в психологии

 

Когнитивная психология

Когда психология впервые возникла как наука, отдельная от биологии и философии, начались споры о том, как описывать и объяснять человеческий разум и поведение. Различные школы психологии представляют основные теории психологии.


Первую школу мысли, структурализм, отстаивал основатель первой психологической лаборатории Вильгельм Вундт . Почти сразу же начали появляться другие теории, соперничающие за господство в психологии.


В прошлом психологи часто отождествляли себя исключительно с одной школой мысли. Сегодня большинство психологов придерживаются эклектичного взгляда на психологию. Они часто опираются на идеи и теории разных школ, а не придерживаются какой-то одной точки зрения.


В этой статье обсуждаются некоторые из основных школ мысли, которые повлияли на наши знания и понимание психологии.


Структуралистская школа мысли

Структурализм широко известен как первая школа мысли в психологии. Эта точка зрения была сосредоточена на разбиении психических процессов на самые основные компоненты. Основные мыслители, связанные со структурализмом, включают Вильгельма Вундта и Эдварда Титченера.


В центре внимания структурализма было сведение психических процессов к их самым основным элементам. Структуралисты использовали такие методы, как самоанализ , для анализа внутренних процессов человеческого разума.


Интроспективная экспериментальная техника, используемая структуралистами, заключалась в том, чтобы обученные наблюдатели изучали их внутренние реакции. Используя этот подход, также известный как экспериментальное самонаблюдение, такие экспериментаторы, как Вундт, обучали людей анализировать свои мысли как можно тщательнее и объективнее.


Хотя эти методы по понятным причинам не были самыми строгими с эмпирической точки зрения, структуралистская школа мысли сыграла важную роль в развитии экспериментальной психологии.


Функционалистская школа мысли

Функционализм сформировался как реакция на теории структуралистской школы мысли и находился под сильным влиянием работ Уильяма Джеймса . Он функционировал на функциях и приспособлениях ума.


Вместо того чтобы сосредотачиваться на самих психических процессах, функционалистские мыслители интересовались той ролью, которую эти процессы играют.


В функционалистском подходе, например, вместо того, чтобы пытаться понять лежащие в основе процессы, вызывающие ментальные состояния, основное внимание будет уделяться пониманию функции, которой служат эти состояния. Лучшее понимание цели позволило бы психологам лучше понять, как разум позволяет людям реагировать и адаптироваться к окружающей среде.


Функционалистская школа интересовалась целью мыслей и поведения, тогда как структурализм интересовался элементами, составляющими сознание. В то время как функционализм в значительной степени исчез как школа мысли, его влияние сохранилось в прикладной психологии, бихевиоризме и педагогической психологии. 1


В отличие от некоторых других известных школ психологии, функционализм не связан с одним доминирующим теоретиком. Наоборот, с этой точкой зрения связан ряд мыслителей-функционалистов, в том числе Джон Дьюи , Джеймс Роуленд Энджелл и Харви Карр. 2


Некоторые историки задаются вопросом, следует ли считать функционализм формальной школой психологии, учитывая отсутствие в нем центрального лидера или формализованных идей. 3

Гештальт школа мысли

Гештальтпсихология была школой психологии, основанной на идее, что люди воспринимают вещи как единое целое. Этот подход к психологии зародился в Германии и Австрии в конце 19 века в ответ на молекулярный подход структурализма.


Среди мыслителей, связанных с гештальт-школой, были Макс Вертхаймер, Вольфганг Келер и Курт Коффка. 


Вместо того, чтобы разбивать мысли и поведение на мельчайшие элементы, гештальт-психологи считали, что вы должны рассматривать опыт в целом. Согласно гештальт-мыслителям, целое больше, чем сумма его частей, философия, известная как холизм . 4


Некоторые примеры гештальт-мышления включают объяснение оптических явлений, таких как визуальные иллюзии. Вертхаймер описал феномен фи, наблюдая, как чередующиеся железнодорожные огни создают иллюзию движения. Это явление предполагает, что последовательность изображений, видимых в быстрой последовательности, воспринимается как движущаяся. 5


Бихевиористская школа мысли

Бихевиоризм стал доминирующей школой мысли в 1950-х годах. Он был основан на работах таких мыслителей, как Джон Б. Уотсон , Иван Павлов и Б. Ф. Скиннер .


Бихевиоризм предполагает, что любое поведение можно объяснить причинами окружающей среды, а не внутренними силами. Бихевиоризм сосредоточен на наблюдаемом поведении . Примеры поведенческих теорий, возникших в это время, включают:


Классическое обусловливание : это тип обучения, который включает в себя связывание ранее нейтрального стимула со стимулом, который естественным образом и автоматически вызывает реакцию. Например, сочетая звук колокольчика с едой. После образования ассоциации ранее нейтральный раздражитель будет вызывать ту же реакцию, что и естественный раздражитель.

Оперантное обусловливание : этот тип обучения включает в себя использование вознаграждений и наказаний для создания связи между поведением и последствиями этого поведения.

Поведенческая школа психологии существенно повлияла на курс психологии. Многие идеи и методы, возникшие в рамках этой школы мысли, до сих пор широко используются. Поведенческое обучение, экономия на символах, терапия отвращения и другие методы часто используются в программах психотерапии и модификации поведения.


Психоаналитическая школа мысли

Психоанализ — школа психологии, основанная Зигмундом Фрейдом . Эта школа мысли подчеркивала влияние бессознательного на поведение. Среди других крупных психоаналитических мыслителей были Анна Фрейд и Отто Ранк, а также неофрейдисты , такие как Эрик Эриксон , Альфред Адлер и Карен Хорни.


Фрейд считал, что человеческий разум состоит из трех элементов: ид, эго и суперэго .


Ид состоит из первичных побуждений.

Эго — это компонент личности, которому поручено иметь дело с реальностью.

Суперэго — это часть личности, которая содержит все идеалы и ценности, которые мы усваиваем от наших родителей и культуры.

Фрейд считал, что взаимодействие этих трех элементов привело ко всему сложному человеческому поведению.


Другие важные теории психоаналитической школы включали идею сознательного и бессознательного, психосексуальный подход Фрейда к развитию личности и концепцию инстинктов жизни и смерти.


Работа Фрейда также сыграла важную роль в развитии разговорной терапии как подхода к лечению психических заболеваний. Многие традиционные фрейдовские подходы к лечению больше не пользуются популярностью, но современная психоаналитическая терапия продолжает играть важную роль в психологии и сегодня. Исследования показали, что использование самоанализа может сыграть важную роль в эмоциональном росте. 6


Резюме

Школа мысли Фрейда имела огромное влияние, но также вызвала серьезные споры. Это противоречие существовало не только в его время, но и в современных дискуссиях о теориях Фрейда.


Гуманистическая школа мысли

Гуманистическая психология развивалась как ответ на психоанализ и бихевиоризм. На развитие этой школы мысли в психологии сильно повлияли работы мыслителей-гуманистов, таких как Абрахам Маслоу , Карл Роджерс и Кларк Мустакас.


В то время как ранние школы мысли были в основном сосредоточены на ненормальном человеческом поведении, гуманистическая психология значительно отличалась в своем акценте на помощь людям в достижении и реализации их потенциала. Вместо этого гуманистическая психология сосредоточилась на таких темах, как:


Стать полностью функционирующей личностью : Человеком, который находится в контакте со своими сокровенными желаниями и доверяет своим инстинктам 7

Индивидуальная свобода воли : способность, которой обладают люди, делать выбор, выбирать курс действий и контролировать свою жизнь.

Иерархия потребностей : теория, представленная Маслоу, предполагающая, что люди были мотивированы серией все более сложных потребностей, начиная с их основных физиологических потребностей и заканчивая потребностью в полной реализации потенциала человека.

Пиковые переживания : моменты чистой, трансцендентной радости, которые играют важную роль в достижении самореализации 8

Самореализация : состояние полного раскрытия своего потенциала.

Гуманистическая психология остается достаточно популярной и сегодня и оказала значительное влияние на другие области психологии, включая позитивную психологию . Эта конкретная отрасль психологии сосредоточена на том, чтобы помочь людям жить более счастливой и полноценной жизнью.


Когнитивная школа мысли

Когнитивная психология — это школа психологии, изучающая психические процессы, в том числе то, как люди думают, воспринимают, запоминают и учатся. Как часть более широкой области когнитивной науки, эта отрасль психологии связана с другими дисциплинами, такими как нейробиология, философия и лингвистика.


Когнитивная психология возникла в 1950-х годах, отчасти как ответ на бихевиоризм. Критики бихевиоризма отмечали, что он не смог объяснить, как внутренние процессы влияют на поведение.


Примеры теорий, выросших из когнитивной школы мысли, включают:


Стадии когнитивного развития : теория, предложенная Жаном Пиаже , согласно которой дети проходят ряд прогрессивных стадий интеллектуального развития.

Социокультурная теория : эта теория, представленная Львом Выготским, рассматривала, как взаимодействие культурных и социальных факторов способствовало когнитивному развитию.

Теория обработки информации . Эта теория предполагает, что мозг функционирует подобно компьютеру, обрабатывая и интерпретируя информацию о мире.

Когнитивно-поведенческая терапия (КПТ) также находилась под сильным влиянием этой психологической точки зрения. КПТ — это подход к лечению, который фокусируется на том, как автоматические негативные модели мышления влияют на поведение и психологические проблемы. 9

Этот период иногда называют «когнитивной революцией», поскольку стало появляться множество исследований в области обработки информации, языка, памяти и восприятия.


Слово из Веривелла

Хотя некоторые школы мысли ушли в безвестность, каждая из них оказала влияние на ход развития психологии. Некоторые более поздние школы психологии, включая бихевиоризм и когнитивную психологию, остаются весьма влиятельными.


Сегодня многие психологи не присоединяются исключительно к какой-то одной школе мысли. Вместо этого они могут использовать более эклектичный подход, опираясь на множество различных точек зрения и теоретических предпосылок.



Что такое гуманистическая психология?

Гуманистическая психология - это точка зрения , которая подчеркивает взгляд на человека в целом и подчеркивает такие понятия, как свободная воля, самоэффективность и самореализация. Вместо того, чтобы концентрироваться на дисфункции, гуманистическая психология стремится помочь людям реализовать свой потенциал и максимизировать свое благополучие.


Эта область психологии возникла в 1950-х годах как реакция на психоанализ и бихевиоризм, доминировавшие в психологии в первой половине века. Психоанализ был сосредоточен на понимании бессознательных мотивов, управляющих поведением, в то время как бихевиоризм изучал процессы обусловливания, которые вызывают поведение.


Мыслители-гуманисты считали, что и психоанализ, и бихевиоризм слишком пессимистичны, либо фокусируясь на самых трагических эмоциях, либо не принимая во внимание роль личного выбора.


Однако не обязательно думать об этих трех  школах мысли  как о конкурирующих элементах. Каждая  отрасль психологии  внесла свой вклад в наше понимание человеческого разума и поведения.


Гуманистическая психология добавила еще одно измерение, которое дает более целостный взгляд на человека.


Другие типы гуманизма

Гуманизм — это философия, которая подчеркивает важность человеческого фактора, а не рассматривает религиозные, божественные или духовные вопросы. Гуманизм основан на идее о том, что люди несут этическую ответственность за то, чтобы вести жизнь, приносящую личное удовлетворение, и в то же время вносить свой вклад во благо всех людей.


Гуманизм подчеркивает важность человеческих ценностей и достоинства. Он предполагает, что люди могут решать проблемы с помощью науки и разума. Вместо обращения к религиозным традициям гуманизм фокусируется на том, чтобы помочь людям жить хорошо, достичь личного роста и сделать мир лучше.


Термин «гуманизм» часто используется в более широком смысле, но он также имеет значение в ряде различных областей, включая психологию.

Религиозный гуманизм

Некоторые религиозные традиции включают элементы гуманизма как часть своих систем верований. Примеры религиозного гуманизма включают квакеров, лютеран и унитаристов-универсалистов. 


Светский гуманизм

Светский гуманизм отвергает все религиозные верования, в том числе существование сверхъестественного. Этот подход подчеркивает важность логики, научного метода и рациональности, когда речь идет о понимании мира и решении человеческих проблем. 


Использование в гуманистической психологии

Гуманистическая психология фокусируется на потенциале каждого человека и подчеркивает важность роста и самореализации . Фундаментальное убеждение гуманистической психологии состоит в том, что люди врожденно добры и что психические и социальные проблемы возникают в результате отклонений от этой естественной склонности.


Гуманистическая психология также предполагает, что люди обладают личной свободой воли и что они мотивированы использовать эту свободную волю для достижения целей, которые помогут им полностью реализовать свой человеческий потенциал.


Потребность в самореализации и личностном росте является ключевым мотиватором любого поведения. Люди постоянно ищут новые способы расти, становиться лучше, узнавать новое, испытывать психологический рост и самореализацию.


Некоторые из способов применения гуманистической психологии в области психологии включают:


Гуманистическая терапия : появилось несколько различных типов психотерапии, основанных на принципах гуманизма. К ним относятся клиент-центрированная терапия, экзистенциальная терапия и гештальт-терапия . 

Личностное развитие : поскольку гуманизм подчеркивает важность самореализации и полного раскрытия своего потенциала, его можно использовать как инструмент самопознания и личного развития.

Социальные изменения . Еще одним важным аспектом гуманизма является улучшение сообществ и обществ. Чтобы люди были здоровыми и целостными, важно развивать общества, которые способствуют личному благополучию и обеспечивают социальную поддержку.

Влияние гуманистической психологии

Гуманистическое движение оказало огромное влияние на курс психологии и внесло новые представления о психическом здоровье. Он предложил новый подход к пониманию человеческого поведения и мотивации и привел к развитию новых методов и подходов к психотерапии .


Некоторые из основных идей и концепций, возникших в результате движения гуманистической психологии, включают в себя акцент на таких вещах, как:


Клиентоцентрированная терапия

Свободная воля

Полностью функционирующий человек

Иерархия потребностей

Пиковые впечатления

Самореализация

Я-концепция

Безусловный положительный отзыв

Как применять гуманистическую психологию

Вот несколько советов из гуманистической психологии, которые могут помочь людям добиться самореализации и актуализации:


Откройте для себя свои сильные стороны

Разработайте видение того, чего вы хотите достичь

Подумайте о своих убеждениях и ценностях

Получайте опыт, который приносит вам радость, и развивайте свои навыки

Научитесь принимать себя и других

Сосредоточьтесь на получении удовольствия, а не просто на достижении целей

Продолжайте учиться новому

Займитесь тем, чем вы увлечены

Сохраняйте оптимистичный взгляд

Одной из сильных сторон гуманистической психологии является то, что она подчеркивает роль личности. Эта школа психологии дает людям больше прав на контроль и определение состояния своего психического здоровья.


Также учитывается влияние окружающей среды. Вместо того, чтобы сосредотачиваться исключительно на наших внутренних мыслях и желаниях, гуманистическая психология также признает влияние окружающей среды на наш опыт.


Гуманистическая психология помогла снять некоторые стигмы, связанные с терапией, и сделала более приемлемым для нормальных, здоровых людей возможность исследовать свои способности и потенциал посредством терапии.


Возможные ловушки

Хотя гуманистическая психология продолжает влиять на терапию, образование, здравоохранение и другие области, не обошлось без критики.


Например, гуманистический подход часто рассматривается как слишком субъективный. Важность индивидуального опыта затрудняет объективное изучение и измерение гуманистических явлений. Как мы можем объективно определить, самореализовался ли кто-то? Ответ, конечно же, что мы не можем. Мы можем полагаться только на оценку человеком своего опыта.


Еще одна серьезная критика заключается в том, что наблюдения не поддаются проверке; нет точного способа измерить или количественно оценить эти качества. Это может затруднить проведение исследований и оценок проектов для измерения трудноизмеримых концепций.


История гуманистической психологии

На раннее развитие гуманистической психологии сильно повлияли работы нескольких ключевых теоретиков, особенно Абрахама Маслоу и Карла Роджерса. Среди других выдающихся мыслителей-гуманистов были Ролло Мэй и Эрих Фромм.


В 1943 году Абрахам Маслоу описал свою иерархию потребностей в «Теории мотивации человека», опубликованной в  Psychological Review.  Позже , в конце 1950- х годов, Авраам Маслоу и другие психологи провели встречи, чтобы обсудить развитие профессиональной организации, занимающейся более гуманистическим подходом к психологии.


Они согласились с тем, что такие темы, как самореализация, творчество, индивидуальность и связанные с ними темы, были центральными темами этого нового подхода. В 1951 году Карл Роджерс опубликовал книгу «Терапия, ориентированная на клиента», в которой описал свой гуманистический, ориентированный на клиента подход к терапии. В 1961 году был основан  Журнал гуманистической психологии  .


Также в 1961 году была создана  Американская ассоциация гуманистической психологии  , а к 1971 году гуманистическая психология стала подразделением АПА. В 1962 году Маслоу опубликовал книгу «На пути к психологии бытия», в которой описал гуманистическую психологию как «третью силу» в психологии. Первой и второй силами были соответственно бихевиоризм и психоанализ.


Слово из Веривелла

Сегодня концепции, занимающие центральное место в гуманистической психологии, можно увидеть во многих дисциплинах, включая другие отрасли психологии, образование, терапию, политические движения и другие области. Например, трансперсональная психология и позитивная психология в значительной степени опираются на гуманистические влияния.


Цели гуманизма остаются такими же актуальными сегодня, как и в 1940-х и 1950-х годах, и гуманистическая психология продолжает расширять возможности людей, улучшать их благосостояние, подталкивать людей к реализации своего потенциала и улучшать сообщества во всем мире.



Структурализм и функционализм были двумя самыми ранними школами психологии. Когда психология впервые стала отдельной от философии наукой, начались споры о том, как объяснить человеческое поведение и проанализировать разум. В результате появились разные подходы и точки зрения.


И функционализм, и структурализм внесли важный вклад в развитие современной психологии . 1 Чтобы получить представление о том, как возникла область психологии и дошла до того, чем она является сегодня, может быть полезно взглянуть на эти старые точки зрения и на то влияние, которое они оказали.


Что такое структурализм?

Структурализм возник как первая школа мысли в психологии. Вильгельм Вундт , основатель первой лаборатории экспериментальной психологии , отстаивал некоторые идеи, связанные со школой структуралистов. 2


Структурализм был первой школой психологии и сосредоточился на разбиении психических процессов на самые основные компоненты. Исследователи пытались понять основные элементы сознания, используя метод, известный как самоанализ .


Один из учеников Вундта, Эдвард Б. Титченер , позже официально установил и дал название структурализму, хотя он порвал со многими идеями Вундта и временами даже искажал учения своего наставника. Теории Вундта, как правило, были гораздо более целостными, чем идеи, которые позже Титченер представил в Соединенных Штатах. 2


Сильные стороны

Структурализм важен, потому что это первая крупная школа мысли в психологии. Структуралистская школа оказала влияние и на развитие экспериментальной психологии. 1


В то время как работа Вундта помогла создать психологию как отдельную науку и внесла свой вклад в экспериментальную психологию, развитие структурализма Титченером помогло создать самую первую «школу» психологии. Сам структурализм просуществовал недолго после смерти Титченера. 2


Критика

По сегодняшним научным стандартам экспериментальные методы, используемые для изучения структур разума, были слишком субъективными — использование самонаблюдения приводило к недостаточной надежности результатов. Другие критики утверждают, что структурализм был слишком озабочен внутренним поведением, которое нельзя наблюдать напрямую и которое нельзя точно измерить. 1


Что такое функционализм?

Появились и другие теории, соперничающие за господство в психологии. В ответ на структурализм американская точка зрения, известная как функционализм, возникла у таких мыслителей, как эволюционист Чарльз Дарвин и Уильям Джеймс . Функционалисты стремились объяснить психические процессы более систематически и точно.


Среди других важных мыслителей-функционалистов были Эдвард Торндайк, Джон Дьюи , Мэри Уитон Калкинс, Харви Карр, Герман Эббингауз и Джон Энджелл. 1


Вместо того, чтобы сосредотачиваться на элементах сознания, функционалисты сосредоточились на цели сознания и поведения. Функционализм также подчеркивал индивидуальные различия, что оказало глубокое влияние на образование.


Сильные стороны

Функционализм оказал большое влияние на психологию. Это повлияло на развитие бихевиоризма и прикладной психологии. 1 Функционализм также повлиял на систему образования, особенно в отношении убеждения Джона Дьюи в том, что дети должны учиться на том уровне, к которому они подготовлены с точки зрения развития. 3


Критика

Функционализм подвергся, пожалуй, самой известной критике со стороны Вундта. «Это литература. Она прекрасна, но это не психология», — сказал он о книге функционалиста Уильяма Джеймса « Принципы психологии» . 4


Структурализм против функционализма

Хотя эти две школы мысли послужили основой для будущего развития психологии, между ними существовали важные различия.


Структурализм

Сосредоточены на том, чтобы разбивать вещи на мельчайшие части


Исследовал возможности разных частей разума


Использовал самоанализ для изучения чувств и ощущений.


Функционализм

Сосредоточены на том, как все работает вместе


Исследовал, как мозг функционирует в различных условиях.


Использовали объективные методы для изучения воспоминаний и эмоций.


Влияние на психологию

В 1906 году Мэри Уитон Калкинс опубликовала в Psychological Review статью с просьбой примирить эти две школы мысли. Она утверждала, что структурализм и функционализм не так уж сильно различаются, поскольку оба в основном связаны с сознательным я. 5


Несмотря на это, каждая сторона продолжала клеветать на другую. Уильям Джеймс писал, что у структурализма «много школы, но нет мыслей», в то время как Вильгельм Вундт отверг функционализм как «литературу» как ненаучную. 6


В конце концов, обе эти школы мысли потеряли господство в психологии, уступив место бихевиоризму , психоанализу , гуманизму и когнитивной психологии в начале и середине двадцатого века.


Слово из Веривелла

Хотя ни одна из этих ранних школ мысли не используется сегодня, обе повлияли на развитие современной психологии. Структурализм сыграл роль в стремлении сделать психологию более экспериментальной наукой, а функционализм заложил основу для развития бихевиоризма.


Поняв эти две школы мысли, вы сможете лучше понять, как психология превратилась в дисциплину, которой она является сегодня.





Что такое теория в психологии?

Психологическая теория — это научно обоснованная идея, объясняющая мысли, эмоции и поведение человека. Любая теория состоит из двух важных компонентов. Он не только описывает поведение, но и предсказывает поведение в будущем. В психологии существует пять основных точек зрения. Это поведенческие, психодинамические, гуманистические, когнитивные и биологические. Их также называют « большими теориями », потому что они охватывают очень широкий спектр и пытаются понять человеческое поведение в целом, а не сосредотачиваются на его узкой части или функции.


 Урок  Контрольный опрос  Курс

63 просмотра

Основные психологические теории

В психологии существует пять основных точек зрения или великих теорий: поведенческая, психодинамическая, гуманистическая, когнитивная и биологическая. Многие другие теории или направления психологии могут проследить свои корни до одной из этих пяти основных теорий.


Поведенческие теории

Теория поведения была доминирующей теорией в Соединенных Штатах в 1920-х и 30-х годах. Он утверждает, что люди учатся поведению через взаимодействие с окружающей средой. Джон Б. Уотсон был первым, кто обнародовал это. Иван Павлов открыл связь между внешними раздражителями и реакциями. Он наиболее известен своими экспериментами с собаками, в которых он продемонстрировал, что с помощью классического обусловливания собак можно «обучить» выделять слюну при звуке колокольчика, если колокольчик звонит каждый раз, когда их кормят.


Оперантное обусловливание было разработано американским психологом Б. Ф. Скиннером. Ключевая идея оперантного обусловливания заключается в том, что поведение усваивается посредством поощрений и наказаний. Эта теория утверждает, что люди перестанут заниматься поведением, которое наказывается, и будут продолжать делать то, что вознаграждается. Скиннер отверг идею свободы воли. Скиннер и его последователи исключили мысли и ментальную жизнь, сосредоточившись вместо этого на подкреплении.


Когнитивные теории

Когнитивные теории утверждают, что человеческое поведение начинается с мыслей человека. Они изучают области восприятия, памяти, категоризации, представления знаний, числового познания, языка и мышления. Когнитивные теоретики, такие как Жан Пиаже, сосредоточились на внимании, памяти и восприятии. Они предположили, что понимание того, как люди запоминают и обрабатывают информацию, станет ключом к пониманию и предсказанию их поведения.


Гуманистические теории

Гуманистические теории предполагают, что люди врожденно хороши и им просто нужна мотивация, чтобы полностью раскрыть свой потенциал. Они считают, что все решения, плохие и хорошие, являются результатом попытки человека улучшить свою жизнь. Известный психолог Карл Роджерс разработал личностно-центрированную терапию. Эта терапия предлагала благоприятную среду и поощряла клиента брать на себя ответственность за свои эмоции и поведение. Абрахам Маслоу, наиболее известный своей концепцией иерархии потребностей, был еще одним теоретиком-гуманистом.


Биологические теории

Биологические теории восходят к ученому Чарльзу Дарвину. Они основаны на идее о том, что люди постепенно приспосабливаются или приспосабливаются к окружающей среде, поэтому большое внимание уделяется генетике. Биологические психологи исследуют связь между поведением и физическим телом. Это включает в себя изучение мозга, нервов и гормонов. Большое внимание уделяется наследственности. Выбор и поведение являются результатом потребностей физического тела или генетики.



Биологическая теория изучает, как мозг и тело влияют на психологию.


Женщина в лабораторном халате указывает на снимки МРТ


Психодинамические теории

Психодинамические теории психологии специализируются на подсознании. Психоаналитик Зигмунд Фрейд первым предложил теорию о том, что подсознание содержит ID, эго и суперэго. ID — это часть людей, которая хочет, чтобы самые основные потребности, такие как голод, были удовлетворены немедленно. Эго включает в себя представление человека о себе. Фрейд предположил, что то, как человек воспринимает себя, влияет на его поведение. Суперэго имеет дело с моральными стандартами, которые управляют ИД и Эго. Фрейд считал, что бессознательное и его социально неприемлемые желания, особенно сексуальные, являются движущей силой многих видов поведения. Цель психодинамической теории заключалась в том, чтобы вывести подсознание на поверхность, чтобы его можно было понять и с ним можно было работать терапевтическим путем.



Зигмунд Фрейд


Фотопортрет Зигмунда Фрейда с сигарой


Среди других видных психодинамических теоретиков были Анна Фрейд и Альфред Адлер. Он подчеркивал потребность каждого человека в принадлежности, предполагая, что все рождаются с чувством неполноценности, и дети начинают преодолевать его в детстве. Он предположил, что некоторые делают это, внося свой вклад в общество и пытаясь добиться добра, в то время как другие пытаются достичь этого, находя способы оказывать влияние на других. Он основал Общество индивидуальной психологии.


Типы психологических теорий

Существует четыре основных типа теорий. Большие теории имеют широкий охват и пытаются объяснить человеческое поведение в целом. Хотя иногда они считаются устаревшими, они послужили основой для исследований и других теорий и в той или иной мере послужили источником информации для каждой отрасли психологии. Другие теории можно разделить на эволюционные, мини или эмерджентные.


Теории развития

Теории развития сосредоточены на детях и на том, как они ведут себя, меняются и растут в течение жизни. Жан Пиаже, швейцарский психолог, первым заявил, что дети думают иначе, чем взрослые. Он предложил четыре стадии развития: сенсомоторную, дооперациональную, конкретно-операциональную и формально-операциональную. Он предложил всем детям проходить через эти различные стадии по мере своего развития. Теория Кольберга морального развития является еще одним примером теории развития.











Что такое психологическая теория?

Теории должны описывать причинные механизмы, а не только ассоциации.

Опубликовано 24 октября 2017 г. |  Отзыв Джессики Шрадер


Поделиться через фейсбукДелиться

Поделиться в ТвиттереТвитнуть

Поделиться по электронной почтеЭл. адрес

Курт Левин сказал, что нет ничего более практичного, чем хорошая теория. Психологические теории ценны для практического руководства в образовании , психическом здоровье, бизнесе и других областях. Они дают ответы на действительно интересные вопросы, касающиеся многих видов мышления, включая восприятие, эмоции, обучение и решение проблем.


В недавней статье Курта Грея психологам предлагается помочь в разработке более совершенных теорий с помощью карт теорий, отображающих связи между различными факторами. Например, теоретическая карта для морального суждения определяет положительную связь между чувством эмпатии и видением уязвимого пациента и отрицательную связь между чувством эмпатии и регулированием эмоций .


Такие ассоциации могут быть эмпирически достоверными, но ассоциации не предоставляют причинно-следственной информации, которая служит для объяснения того, почему люди делают то, что они делают, и которая направляет вмешательства в мир для решения практических проблем. Карты ассоциации не соответствуют объяснительным теориям.


Так что же такое психологическая теория? В физике теории обычно представляют собой наборы математических уравнений, определяющих причинные факторы. Например, ньютоновская теория движения планет формулирует уравнения для описания того, как такие силы, как гравитация, заставляют планеты двигаться. Психология слишком запутана, чтобы допускать теории такого рода.


Лучшие методологические образцы для подражания исходят от биологии и медицины. Теории в биологии обычно состоят из описаний механизмов, представляющих собой комбинации связанных частей, взаимодействие которых приводит к регулярным изменениям. Например, в генетике частями являются клетки, гены, белки и другие сущности, которые взаимодействуют, чтобы произвести наследование и отбор. Медицинские теории нацелены на объяснение и лечение болезней и обычно действуют, указывая на то, как механизмы, полезные для функционирования организма, могут выйти из строя, например, при закупорке артерий во время сердечного приступа.


Точно так же мы можем искать механистические объяснения в психологии на двух уровнях: репрезентативном и нейронном . После когнитивной революции 1950-х и 1960-х годов психология использовала объяснения с точки зрения ментальных репрезентаций, таких как понятия, схемы и правила. Это части ментальных систем, которые взаимодействуют друг с другом посредством вычислительных процессов, таких как вывод и активация распространения. Работа этих психологических механизмов описана с достаточной точностью, чтобы запускать компьютерные симуляции на когнитивных архитектурах, таких как ACT и Soar.


Когнитивная архитектура — это общее предложение о представлениях и процессах, порождающих мысли. Хорошая стратегия для психологов, которые хотят теоретизировать о своей эмпирической работе, состоит в том, чтобы попытаться показать, как явления могут быть каузально объяснены операциями когнитивной архитектуры. Но не все когнитивные архитектуры вызывают символическое, вербальное мышление.


С 1980-х годов психология все чаще разрабатывает объяснения с точки зрения нейронных механизмов, где частями являются нейроны, связи — синапсы, а взаимодействия включают возбуждение и торможение, которые приводят к паттернам возбуждения нейронов. Известные когнитивные архитектуры нейронных сетей включают PDP (параллельная распределенная обработка), Leabra и CLARION. Следовательно, альтернативная стратегия психологического теоретизирования состоит в том, чтобы показать, что явления являются результатом нейронных механизмов.


Моя любимая когнитивная архитектура — это архитектура семантических указателей Криса Элиасмита, которая сочетает в себе богатые нейронные механизмы с возможностью моделирования представлений высокого уровня, таких как концепции, и символических выводов, таких как дедукция. Он имеет множество объяснительных приложений, начиная от управления моторикой и заканчивая сознанием.


Все эти когнитивные архитектуры являются подлинными теориями в том смысле, что они обеспечивают описание механизмов, причинно объясняющих широкий спектр явлений. Эти механизмы объясняют, почему что-то происходит, и дают рекомендации о том, как вмешиваться в мир, чтобы получить практическую пользу. Так что они более эффективны как теоретически, так и практически, чем наборы ассоциаций. Психологии действительно нужны лучшие теории, но они должны быть те, которые определяют причинно-следственные механизмы.






  https://saylordotorg.github.io/text_research-methods-in-psychology/s09-psychological-measurement.html




Психологическое измерение

Исследователей Тару Макдональд и Аланну Мартино интересовало влияние настроения студенток колледжа на их намерения вступить в незащищенный половой акт (MacDonald & Martineau, 2002). Макдональд, Т.К., и Мартино, А.М. (2002). Самооценка, настроение и намерения использовать презервативы: когда низкая самооценка приводит к опасному для здоровья поведению? Журнал экспериментальной социальной психологии, 38 , 299–306.В тщательно спланированном эмпирическом исследовании они обнаружили, что плохое настроение увеличивает намерения заниматься незащищенным сексом, но только у студентов с низкой самооценкой. Хотя при проведении подобных исследований возникает множество проблем, одной из основных является измерение соответствующих переменных. В этом исследовании исследователям нужно было знать, была ли у каждого из их участников высокая или низкая самооценка, что, конечно же, требовало измерения их самооценки. Им также нужно было убедиться, что их попытка создать у людей негативное настроение (заставляя их думать о негативных мыслях) была успешной, что требовало измерения их настроения. Наконец, им нужно было увидеть, связаны ли самооценка и настроение с намерениями участников вступить в незащищенный половой акт, что требовало измерения этих намерений.


Студентам, которые только начинают заниматься психологическими исследованиями, задача измерения таких переменных может показаться непреодолимой. Действительно ли возможно измерить такие неосязаемые вещи, как самооценка, настроение или намерение что-то сделать? Ответ — решительное «да», и в этой главе мы внимательно рассмотрим природу переменных, которые изучают психологи, и то, как их можно измерить. Мы также рассмотрим некоторые практические вопросы психологического измерения.


Считаете ли вы себя достойным человеком?

Шкала самооценки Розенберга (Розенберг, 1989) Розенберг М. (1989). Общество и представление о себе подростка (ред. ред.). Мидлтаун, Коннектикут: Издательство Уэслианского университета. — один из наиболее распространенных показателей самооценки, который Макдональд и Мартино использовали в своем исследовании. Участники отвечают на каждый из 10 следующих пунктов оценкой по 4-балльной шкале: Полностью согласен , Согласен , Не согласен , Категорически не согласен . Оцените пункты 1, 2, 4, 6 и 7, назначив 3 балла за каждый ответ « Полностью согласен », 2 балла за каждый ответ « Согласен », 1 балл за каждый ответ « Не согласен » и 0 баллов за каждый ответ «Абсолютно не согласен ».. Поменяйте местами подсчет баллов по пунктам 3, 5, 8, 9 и 10, назначив 0 баллов за каждый пункт « Полностью согласен », по 1 баллу за каждый пункт « Согласен » и так далее. Общий балл – это общее количество баллов.


Я чувствую, что я достойный человек, по крайней мере, наравне с другими.

Я чувствую, что у меня есть ряд хороших качеств.

В общем, я склонен считать себя неудачником.

Я могу делать вещи так же хорошо, как и большинство других людей.

Я чувствую, что мне нечем гордиться.

Я положительно отношусь к себе.

В целом я доволен собой.

Я хотел бы иметь больше уважения к себе.

Иногда я чувствую себя бесполезным.

Иногда мне кажется, что я совсем нехороший.

5.1 Понимание психологических измерений

ЦЕЛИ ОБУЧЕНИЯ

Дайте определение измерения и приведите несколько примеров измерения в психологии.

Объясните, что такое психологический конструкт, и приведите несколько примеров.

Отличайте концептуальные определения от операционных, приведите примеры каждого из них и создавайте простые рабочие определения.

Укажите четыре уровня измерения, приведите примеры каждого из них и объясните, почему это различие важно.

Что такое измерение?

Измерение - это присвоение баллов отдельным лицам, чтобы баллы отражали некоторые характеристики людей. Это очень общее определение согласуется со способами измерения, с которыми все знакомы, например, взвешиванием себя, встав на напольные весы, или проверкой внутренней температуры жареной индейки с помощью термометра для мяса. Это также согласуется с измерениями во всех науках. В физике, например, можно измерить потенциальную энергию объекта в гравитационном поле Земли, найдя его массу и высоту (что, конечно, требует измерения этих переменных), а затем перемножив их вместе с ускорением свободного падения Земли (9,8 м/с). с 2). Результатом этой процедуры является оценка, которая представляет потенциальную энергию объекта.


Конечно, это общее определение измерения согласуется и с измерением в психологии. (Психологические измерения часто называют психометрическими.) Представьте, например, что когнитивный психолог хочет измерить объем рабочей памяти человека — его или ее способность удерживать в уме и обдумывать несколько фрагментов информации одновременно. Для этого она может использовать задание на диапазон цифр в обратном порядке, в котором она читает человеку список из двух цифр и просит его или ее повторить их в обратном порядке. Затем она повторяет это несколько раз, каждый раз увеличивая длину списка на одну цифру, пока человек не сделает ошибку. Длина самого длинного списка, на который человек отвечает правильно, является оценкой и представляет его или ее объем рабочей памяти. Или представьте себе клинического психолога, который интересуется, насколько депрессивен человек. Он ведет инвентаризацию депрессии Бека, который представляет собой анкету для самоотчетов из 21 пункта, в которой человек оценивает степень, в которой он или она чувствовал себя грустным, потерял энергию и испытывал другие симптомы депрессии за последние 2 недели. Сумма этих 21 оценок является оценкой и представляет его или ее текущий уровень депрессии.


Важным моментом здесь является то, что измерение не требует каких-либо конкретных инструментов или процедур. Для этого не требуется помещать людей или предметы на весы в ванной, подносить к ним линейки или вставлять в них термометры. Что для этого действительно требуется, так это некоторая систематическая процедура присвоения баллов индивидуумам или объектам, чтобы эти баллы представляли интересующую характеристику.


Психологические конструкции

Многие переменные, изучаемые психологами, просты и легко поддаются измерению. К ним относятся пол, возраст, рост, вес и порядок рождения. Вы почти всегда можете сказать, мужчина это или женщина, просто взглянув. Вы можете спросить людей, сколько им лет, и быть достаточно уверенными в том, что они знают и скажут вам. Хотя люди могут не знать или не захотеть сообщить вам, сколько они весят, вы можете попросить их встать на весы в ванной. Другие переменные, изучаемые психологами — возможно, большинство — не так просто измерить. Мы не можем точно оценить уровень интеллекта людей, глядя на них, и мы, конечно же, не можем оценить их самооценку на весах в ванной. Переменные такого типа называются конструкциями (произносится как CON-structs).) и включают черты личности (например, экстраверсия), эмоциональные состояния (например, страх), отношение (например, к налогам) и способности (например, атлетизм).


Психологические конструкции нельзя наблюдать непосредственно. Одна из причин заключается в том, что они часто отражают тенденции мыслить, чувствовать или действовать определенным образом. Например, чтобы сказать, что конкретный студент колледжа очень экстравертный (см. примечание 5.6 «Большая пятерка» ,) не обязательно означает, что прямо сейчас она ведет себя экстравертно. На самом деле, она могла бы спокойно сидеть одна и читать книгу. Наоборот, это означает, что у нее есть общая склонность вести себя экстравертно (разговаривать, смеяться и т. д.) в различных ситуациях. Другая причина, по которой психологические конструкты нельзя наблюдать напрямую, заключается в том, что они часто связаны с внутренними процессами. Страх, например, включает в себя активацию определенных структур центральной и периферической нервной системы, наряду с определенными видами мыслей, чувств и поведения, ни одно из которых не обязательно очевидно для стороннего наблюдателя. Заметьте также, что ни экстраверсия, ни страх не «сводятся» к какой-либо конкретной мысли, чувству, действию или физиологической структуре или процессу. Наоборот, каждый из них представляет собой своего рода резюме сложного набора моделей поведения и внутренних процессов.


Большая пятерка

«Большая пятерка» — это набор из пяти широких измерений, которые охватывают большую часть вариаций человеческой личности. Каждую из «Большой пятерки» можно даже определить с помощью шести более конкретных конструктов, называемых «фасетами» (Costa & McCrae, 1992). Коста, П.Т., младший, и Маккрей, Р.Р. (1992). Нормальная оценка личности в клинической практике: Опросник личности NEO. Психологическая оценка, 4 , 5–13.


Рисунок 5.1

Большая пятерка личностных характеристик



Концептуальное определение психологического конструкта описывает поведение и внутренние процессы, составляющие этот конструкт, а также то, как он соотносится с другими переменными. Например, концептуальное определение невротизма (еще одного из Большой пятерки) будет состоять в том, что это склонность людей испытывать негативные эмоции, такие как тревога, гнев и печаль, в различных ситуациях. Это определение может также включать в себя то, что оно имеет сильный генетический компонент, остается довольно стабильным с течением времени и положительно коррелирует с тенденцией испытывать боль и другие физические симптомы.


Студенты иногда недоумевают, почему, когда исследователи хотят понять такой конструкт, как самооценка или невротизм, они просто не ищут его в словаре. Одна из причин заключается в том, что многие научные конструкции не имеют аналогов в повседневном языке (например, объем рабочей памяти). Что еще более важно, исследователи занимаются разработкой определений, которые являются более подробными и точными — и которые более точно описывают то, как устроен мир, — чем неформальные определения в словаре. Как мы увидим, они делают это, предлагая концептуальные определения, проверяя их эмпирически и пересматривая по мере необходимости. Иногда их вообще выбрасывают. Вот почему исследовательская литература часто включает разные концептуальные определения одного и того же конструкта. В некоторых случаях, старое концептуальное определение было заменено более новым, которое работает лучше. В других исследователи все еще находятся в процессе принятия решения о том, какое из различных концептуальных определений является лучшим.


Операционные определения

Операционное определение — это определение переменной с точки зрения того, как именно она должна быть измерена. Эти меры обычно относятся к одной из трех широких категорий. Меры самоотчета - это те, в которых участники сообщают о своих мыслях, чувствах и действиях, как в случае со шкалой самооценки Розенберга. Поведенческие мерыте, в которых некоторые другие аспекты поведения участников наблюдаются и записываются. Это чрезвычайно широкая категория, включающая наблюдение за поведением людей как в строго структурированных лабораторных задачах, так и в более естественных условиях. Хорошим примером первого может быть измерение объема рабочей памяти с помощью задачи обратного диапазона цифр. Хорошим примером последнего является известное операциональное определение физической агрессии, данное исследователем Альбертом Бандурой и его коллегами (Bandura, Ross & Ross, 1961). Бандура, А., Росс, Д., и Росс, С.А. (1961). Передача агрессии через подражание агрессивным моделям. Журнал ненормальной и социальной психологии, 63 , 575–582.Они позволили каждому из нескольких детей поиграть в течение 20 минут в комнате, где была боксерская груша в форме клоуна, называемая куклой Бобо. Они снимали каждого ребенка на видео и подсчитывали количество совершенных им актов физической агрессии. К ним относятся удары по кукле молотком, удары руками и ногами. Таким образом, их операциональным определением было количество этих специально определенных действий, которые ребенок совершил за 20-минутный период. Наконец, физиологические измерения — это те, которые включают регистрацию любого из широкого спектра физиологических процессов, включая частоту сердечных сокращений и артериальное давление, кожно-гальваническую реакцию, уровни гормонов, электрическую активность и кровоток в головном мозге.


Рисунок 5.2



В дополнение к самоотчетам и поведенческим показателям исследователи в области психологии используют физиологические показатели. Электроэнцефалограф (ЭЭГ) регистрирует электрическую активность головного мозга.


Источник: Фото предоставлено Джеймсом МакКью.


Для любой заданной переменной или конструкции будет несколько операционных определений. Стресс — хороший пример. Грубое концептуальное определение состоит в том, что стресс — это адаптивная реакция на воспринимаемую опасность или угрозу, которая включает физиологические, когнитивные, аффективные и поведенческие компоненты. Но исследователи оперативно определили его несколькими способами. Шкала оценки социальной адаптации представляет собой анкету для самоотчетов, в которой люди определяют стрессовые события, которые они испытали в прошлом году, и присваивают каждому из них баллы в зависимости от его серьезности. Например, мужчина, который развелся (73 балла), сменил работу (36 баллов) и изменил привычку спать (16 баллов) в прошлом году, получит в сумме 125 баллов. Шкала ежедневных хлопот и подъемов аналогична, но фокусируется на повседневных стрессовых факторах, таких как потеря вещей и беспокойство о своем весе. Шкала воспринимаемого стресса — это еще одна мера самоотчета, которая фокусируется на чувстве людей к стрессу (например, «Как часто вы нервничали и испытывали стресс?»). Исследователи также оперативно определили стресс с точки зрения нескольких физиологических переменных, включая артериальное давление и уровень гормона стресса кортизола.


Когда психологи используют несколько операционных определений одного и того же конструкта — в рамках исследования или между исследованиями — они используют конвергентные операции . Идея состоит в том, что различные операциональные определения «сходятся» к одной и той же конструкции. Когда баллы, основанные на нескольких различных операционных определениях, тесно связаны друг с другом и дают сходные модели результатов, это служит хорошим доказательством того, что конструкт измеряется эффективно и что он полезен. Различные показатели стресса, например, коррелируют друг с другом, и было показано, что все они коррелируют с другими переменными, такими как функционирование иммунной системы (также измеряемое различными способами) (Segerstrom & Miller, 2004).Сегерстром, SE, и Миллер, GE (2004). Психологический стресс и иммунная система человека: метааналитическое исследование 30-летнего исследования. Психологический бюллетень, 130 , 601–630. Именно это позволяет исследователям в конечном итоге делать полезные общие выводы, такие как «стресс отрицательно коррелирует с работой иммунной системы», в отличие от более конкретных и менее полезных выводов, таких как «баллы людей по шкале воспринимаемого стресса отрицательно коррелируют с их показатели белой крови».


Уровни измерения

Психолог С. С. Стивенс предположил, что людям можно назначать баллы, чтобы они сообщали более или менее количественную информацию об интересующей нас переменной (Stevens, 1946). Стивенс, СС (1946). К теории весов измерений. Наука, 103 , 677–680.Например, официальные лица на 100-метровом забеге могут просто ранжировать бегунов по мере их пересечения финишной черты (первым, вторым и т. д.) или могут измерять время каждого бегуна с точностью до ближайшей десятой доли секунды с помощью секундомера (11,5). с, 12,1 с и др.). В любом случае они будут измерять время бегунов, систематически присваивая баллы для представления этого времени. Но в то время как процедура ранжирования сообщает о том, что бегуну, занявшему второе место, потребовалось больше времени, чтобы финишировать, чем бегуну, занявшему первое место, процедура секундомера также сообщает , сколько времени потребовалось бегуну, занявшему второе место. Стивенс фактически предложил четыре разных уровня измерения.(которые он назвал «шкалами измерения»), которые соответствуют четырем различным уровням количественной информации, которую можно передать с помощью набора баллов.


Номинальный уровень измерения используется для категориальных переменных и включает присвоение оценок, которые являются метками категорий. Метки категорий сообщают, являются ли какие-либо два человека одинаковыми или разными с точки зрения измеряемой переменной. Например, если вы смотрите на участников исследования, когда они входят в комнату, решаете, кто из них мужчина или женщина, и вводите эту информацию в электронную таблицу, вы участвуете в измерении номинального уровня. Или, если вы попросите участников указать, к какой из нескольких этнических групп они себя относят, вы снова будете вовлечены в измерение номинального уровня.


Остальные три уровня измерения используются для количественных переменных. Порядковый уровень измерения включает присвоение баллов таким образом, чтобы они представляли ранговый порядок отдельных лиц. Ранги сообщают не только о том, являются ли какие-либо два человека одинаковыми или разными с точки зрения измеряемой переменной, но также и о том, находится ли один человек выше или ниже по этой переменной. Уровень интервалаизмерения включает присвоение баллов таким образом, чтобы они представляли точную величину различий между людьми, но нулевой балл на самом деле не означает полное отсутствие характеристики. Классическим примером является измерение тепла по шкале Цельсия или Фаренгейта. Разница между температурами 20°С и 25°С составляет ровно 5°, но температура 0°С не означает полного отсутствия тепла. В психологии часто считается, что коэффициент интеллекта (IQ) измеряется на интервальном уровне. Наконец, уровень соотношенияизмерения включает присвоение баллов таким образом, чтобы была истинная нулевая точка, которая представляет полное отсутствие количества. Хорошими примерами являются рост, измеряемый в метрах, и вес, измеряемый в килограммах. Так же как и подсчет отдельных объектов или событий, таких как количество братьев и сестер или количество вопросов, на которые учащийся правильно ответил на экзамене.


Уровни измерений Стивенса важны как минимум по двум причинам. Во-первых, они подчеркивают общность концепции измерения. Хотя люди обычно не думают о категоризации или ранжировании индивидуумов как об измерении, на самом деле они таковыми являются до тех пор, пока они представляют некоторые характеристики индивидуумов. Во-вторых, уровни измерения могут служить грубым ориентиром для статистических процедур, которые можно использовать с данными, и для выводов, которые можно на их основе сделать. Например, при измерении номинального уровня единственной доступной мерой центральной тенденции является мода. Кроме того, измерение на уровне отношений — это единственный уровень, на котором можно делать осмысленные утверждения о соотношении баллов.


КЛЮЧЕВЫЕ ВЫВОДЫ

Измерение - это присвоение баллов отдельным лицам, чтобы баллы отражали некоторые характеристики людей. Психологическое измерение может быть достигнуто самыми разными способами, включая самооценку, поведенческие и физиологические измерения.

Психологические конструкты, такие как интеллект, самооценка и депрессия, являются переменными, которые нельзя непосредственно наблюдать, поскольку они отражают поведенческие тенденции или сложные модели поведения и внутренних процессов. Важной целью научных исследований является концептуальное определение психологических конструктов таким образом, чтобы они точно описывались.

Для любого концептуального определения конструкции будет много различных операционных определений или способов ее измерения. Использование нескольких операционных определений или конвергентных операций является обычной стратегией в психологических исследованиях.

Переменные могут быть измерены на четырех различных уровнях — номинальном, порядковом, интервальном и относительном, — которые сообщают все больше количественной информации. Уровень измерения влияет на виды статистических данных, которые вы можете использовать, и на выводы, которые вы можете сделать из своих данных.

УПРАЖНЕНИЯ

Практика: заполните шкалу самооценки Розенберга и подсчитайте свой общий балл.

Практика: придумайте три рабочих определения сексуальной ревности, решительности и социальной тревожности. Рассмотрите возможность самоотчета, поведенческих и физиологических показателей. Будьте максимально точны.

Практика: Для каждой из следующих переменных решите, какой уровень измерения используется.


Преподаватель колледжа измеряет время, затрачиваемое его студентами на сдачу экзамена, просматривая стопку экзаменов в конце. Он присваивает тому, что внизу, 1 балл, тому, что сверху, — 2 и так далее.

Исследователь получает доступ к медицинским картам своих участников и подсчитывает, сколько раз они посещали врача за последний год.

Участников исследования спрашивают, правши они или левши.

5.2 Надежность и достоверность измерения

ЦЕЛИ ОБУЧЕНИЯ

Дайте определение надежности, включая различные типы и способы их оценки.

Определить достоверность, включая различные типы и способы их оценки.

Опишите виды доказательств, которые могут иметь отношение к оценке надежности и валидности конкретной меры.

Опять же, измерение включает в себя присвоение баллов людям, чтобы они представляли некоторые характеристики людей. Но откуда исследователи узнают, что баллы на самом деле отражают характеристику, особенно когда речь идет о таком конструкте, как интеллект, самооценка, депрессия или объем оперативной памяти? Ответ заключается в том, что они проводят исследование с использованием меры, чтобы подтвердить, что оценки имеют смысл, исходя из их понимания измеряемой конструкции. Это чрезвычайно важный момент. Психологи не просто предполагают , что их меры работают. Вместо этого они собирают данные, чтобы продемонстрировать , что они работают. Если их исследование не показывает, что мера работает, они перестают ее использовать.


В качестве неформального примера представьте, что вы уже месяц сидите на диете. Ваша одежда кажется более свободной, и несколько друзей спрашивали, похудели ли вы. Если бы в этот момент ваши весы в ванной показывали, что вы потеряли 10 фунтов, это имело бы смысл, и вы продолжали бы пользоваться весами. Но если бы оно указывало на то, что вы набрали 10 фунтов, вы бы правильно заключили, что оно сломано, и либо починили бы его, либо избавились от него. При оценке метода измерения психологи учитывают два основных аспекта: надежность и валидность.


Надежность

Надежность относится к постоянству меры. Психологи рассматривают три типа согласованности: во времени (надежность повторного тестирования), между элементами (внутренняя согласованность) и между разными исследователями (между разными исследователями).


Проверка надежности

Когда исследователи измеряют конструкт, который, по их мнению, неизменен во времени, полученные им баллы также должны быть постоянными во времени. Ретестовая надежность — это степень, в которой это действительно так. Например, обычно считается, что интеллект неизменен во времени. Человек, который очень умен сегодня, будет очень умным на следующей неделе. Это означает, что любая хорошая мера интеллекта должна дать этому человеку примерно такие же оценки на следующей неделе, как и сегодня. Ясно, что мера, которая дает крайне противоречивые оценки во времени, не может быть очень хорошей мерой конструкции, которая должна быть последовательной.


Оценка надежности повторного тестирования требует одновременного использования показателя для группы людей, повторного использования его для той же группы людей в более позднее время, а затем изучения корреляции между двумя наборами оценок. Обычно это делается путем графического отображения данных на диаграмме рассеяния и вычисления r Пирсона . На рисунке 5.3 «Корреляция тестов и повторных тестов между двумя наборами баллов нескольких студентов колледжа по шкале самооценки Розенберга, полученных два раза в неделю с разницей» показана корреляция между двумя наборами баллов нескольких студентов колледжа по шкале самооценки Розенберга. , учитывая два раза в неделю друг от друга. Пирсон рдля этих данных +0,95. В целом считается, что корреляция между тестом и повторным тестом +,80 или выше указывает на хорошую надежность.


Рис. 5.3. Корреляция тестов и повторных тестов между двумя наборами оценок нескольких студентов колледжа по шкале самооценки Розенберга, полученных два раза с интервалом в неделю



Опять же, высокая корреляция между тестом и повторным тестом имеет смысл, когда предполагается, что измеряемый конструкт неизменен во времени, как в случае с интеллектом, самооценкой и личностными параметрами Большой пятерки. Но другие конструкции не считаются стабильными во времени. Например, сама природа настроения такова, что оно меняется. Таким образом, мера настроения, которая показала низкую корреляцию между тестами и повторными тестами в течение месяца, не должна вызывать беспокойства.


Внутренняя согласованность

Второй вид надежности — внутренняя согласованность ., который представляет собой постоянство ответов людей по пунктам измерения, состоящего из нескольких пунктов. В целом предполагается, что все пункты таких показателей отражают одну и ту же базовую конструкцию, поэтому баллы людей по этим пунктам должны коррелировать друг с другом. По шкале самооценки Розенберга люди, согласные с тем, что они достойные люди, должны склонны соглашаться с тем, что они обладают рядом хороших качеств. Если ответы людей на разные элементы не коррелируют друг с другом, то больше не имеет смысла утверждать, что все они измеряют одну и ту же лежащую в основе конструкцию. Это верно как для поведенческих и физиологических показателей, так и для показателей самоотчетов. Например, люди могут сделать серию ставок в смоделированной игре в рулетку, чтобы измерить уровень своего стремления к риску.


Как и надежность повторных испытаний, внутреннюю согласованность можно оценить только путем сбора и анализа данных. Один из подходов заключается в рассмотрении корреляции пополам . Это включает в себя разделение элементов на два набора, таких как первая и вторая половины элементов или элементы с четными и нечетными номерами. Затем для каждого набора элементов вычисляется оценка, и проверяется взаимосвязь между двумя наборами оценок. Например, на рис. 5.4 «Двойная корреляция между оценками нескольких студентов колледжа по четным пунктам и их оценками за нечетные пункты шкалы самооценки Розенберга» показана разделенная пополам корреляция между оценками нескольких студентов колледжа. баллы по четным пунктам и их баллы по нечетным пунктам шкалы самооценки Розенберга. Пирсонаr для этих данных составляет +,88. Половинная корреляция +,80 или выше обычно считается хорошей внутренней согласованностью.


Рисунок 5.4. Корреляция с разделением пополам между оценками нескольких студентов колледжа по четным пунктам и их оценками по нечетным пунктам шкалы самооценки Розенберга



Возможно, наиболее распространенной мерой внутренней согласованности, используемой исследователями в области психологии, является статистика, называемая альфа Кронбаха (греческая буква альфа). Концептуально α является средним значением всех возможных корреляций разделения пополам для набора элементов. Например, существует 252 способа разделить набор из 10 предметов на два набора по пять. α Кронбаха будет средним из 252 разделенных пополам корреляций. Обратите внимание, что это не то, как на самом деле вычисляется α, но это правильный способ интерпретации значения этой статистики. Опять же, значение +,80 или выше обычно считается показателем хорошей внутренней согласованности.


Межоценочная надежность

Многие поведенческие показатели требуют значительных суждений со стороны наблюдателя или оценщика. Межрейтинговая надежностьнасколько разные наблюдатели последовательны в своих суждениях. Например, если вы заинтересованы в измерении социальных навыков студентов колледжа, вы можете сделать видеозаписи их общения с другим студентом, которого они встречают впервые. Затем вы можете попросить двух или более наблюдателей посмотреть видео и оценить уровень социальных навыков каждого учащегося. В той мере, в какой каждый участник действительно обладает определенным уровнем социальных навыков, который может быть обнаружен внимательным наблюдателем, оценки разных наблюдателей должны сильно коррелировать друг с другом. Если бы это было не так, то эти рейтинги не могли бы точно отражать социальные навыки участников. Надежность между экспертами часто оценивается с использованием α Кронбаха, когда суждения количественные, или аналогичной статистики, называемойκ Коэна (греческая буква каппа), когда они категоричны.


Срок действия

Срок действия- это степень, в которой оценки меры представляют переменную, для которой они предназначены. Но как исследователи делают это суждение? Мы уже рассмотрели один фактор, который они учитывают, — надежность. Когда мера имеет хорошую надежность повторного тестирования и внутреннюю согласованность, исследователи должны быть более уверены в том, что оценки представляют то, что они должны представлять. Однако это должно быть нечто большее, потому что мера может быть чрезвычайно надежной, но не иметь никакой достоверности. В качестве абсурдного примера представьте себе человека, который считает, что длина указательного пальца человека отражает его самооценку, и поэтому пытается измерить самооценку, поднося линейку к указательным пальцам людей. Хотя эта мера будет иметь чрезвычайно хорошую надежность при повторном тестировании, она будет абсолютно недействительной.


Презентация валидности в учебниках обычно делит ее на несколько отдельных «типов». Но хороший способ интерпретировать эти типы состоит в том, что они представляют собой другие виды доказательств — в дополнение к надежности — которые следует принимать во внимание при оценке достоверности меры. Здесь мы рассматриваем четыре основных типа: валидность лица, содержательная валидность, критериальная валидность и дискриминантная валидность.


Проверка лица

Лицевая валидность — это степень, в которой метод измерения выглядит «на лицо» для измерения интересующей конструкции. Большинство людей ожидает, что анкета самооценки будет включать вопросы о том, считают ли они себя достойным человеком и считают ли они себя хорошими качествами. Таким образом, анкета, включающая такие пункты, будет иметь хорошую внешнюю валидность. С другой стороны, метод измерения самооценки по длине пальца, по-видимому, не имеет ничего общего с самооценкой и, следовательно, имеет низкую кажущуюся валидность. Хотя кажущаяся валидность может быть оценена количественно — например, когда большая выборка людей оценивает меру с точки зрения того, измеряет ли она то, для чего предназначена, — ее обычно оценивают неформально.


Лицевая валидность — это в лучшем случае очень слабое доказательство того, что метод измерения измеряет то, что он должен измерять. Одна из причин заключается в том, что он основан на интуитивных представлениях людей о человеческом поведении, которые часто ошибочны. Также верно и то, что многие общепризнанные меры в психологии работают достаточно хорошо, несмотря на то, что им не хватает внешней достоверности. Миннесотский многофазный личностный опросник (MMPI) измеряет многие личностные характеристики и расстройства, предлагая людям решить, применимо ли к ним каждое из более чем 567 различных утверждений, причем многие из утверждений не имеют никакого очевидного отношения к конструкту, который они измеряют. Другим примером является тест на имплицитные ассоциации, который измеряет предрассудки неинтуитивным для большинства людей способом (см. примечание 5.31 «Насколько вы предвзяты?» ).


Насколько вы предвзяты?

Тест имплицитных ассоциаций (IAT) используется для измерения отношения людей к различным социальным группам. IAT - это поведенческая мера, предназначенная для выявления негативных установок, в которых люди могут не признаваться при самоотчете. Он фокусируется на том, насколько быстро люди могут классифицировать слова и изображения, представляющие две контрастирующие группы (например, геев и гетеросексуалов), а также другие положительные и отрицательные стимулы (например, слова «замечательный» или «неприятный»). IAT использовался в десятках опубликованных научных исследований, и имеются убедительные доказательства как его надежности, так и валидности (Nosek, Greenwald, & Banaji, 2006). Носек, Б.А., Гринвальд, А.Г., и Банаджи, М.Р. (2006). Тест имплицитных ассоциаций в возрасте 7 лет: методологический и концептуальный обзор. В Дж. А. Барге (ред.),Социальная психология и бессознательное: автоматизм высших психических процессов (стр. 265–292). Лондон, Англия: Psychology Press. Вы можете узнать больше о IAT — и взять некоторые из них для себя — на следующем веб-сайте: https://implicit.harvard.edu/implicit .


Содержание действия

Содержание действияэто степень, в которой мера «покрывает» интересующий конструкт. Например, если исследователь концептуально определяет тестовую тревожность как активацию симпатической нервной системы (ведущую к нервным переживаниям) и негативные мысли, то его мера тестовой тревожности должна включать пункты, касающиеся как нервных переживаний, так и негативных мыслей. Или учтите, что отношения обычно определяются как включающие мысли, чувства и действия по отношению к чему-либо. Согласно этому концептуальному определению, человек позитивно относится к физическим упражнениям в той мере, в какой он или она позитивно мыслит об упражнениях, чувствует себя хорошо во время упражнений и действительно занимается ими. Таким образом, чтобы иметь хорошую содержательную валидность, мера отношения людей к физическим упражнениям должна отражать все три аспекта. Как лицо достоверности, содержательная валидность обычно не оценивается количественно. Вместо этого он оценивается путем тщательной проверки метода измерения на соответствие концептуальному определению конструкции.


Критерий достоверности

Валидность критерия — это степень, в которой оценки людей по какому-либо показателю коррелируют с другими переменными (известными как критерии ), с которыми можно было бы ожидать их корреляции. Например, результаты людей по новому показателю тестовой тревожности должны иметь отрицательную корреляцию с их успеваемостью на важном школьном экзамене. Если бы было обнаружено, что баллы людей на самом деле отрицательно коррелируют с их успеваемостью на экзамене, то это было бы доказательством того, что эти баллы действительно отражают тревожность людей перед экзаменами. Но если бы было обнаружено, что люди получают одинаковые результаты на экзамене независимо от их оценки тревожности во время теста, это поставило бы под сомнение достоверность измерения.


Критерием может быть любая переменная, которая, как есть основания полагать, должна быть коррелирована с измеряемым конструктом, и обычно их будет много. Например, можно было бы ожидать, что показатели тревожности при тестировании будут отрицательно коррелировать с успеваемостью на экзамене и оценками за курс и положительно коррелировать с общей тревожностью и кровяным давлением во время экзамена. Или представьте, что исследователь разрабатывает новую меру физического риска. Баллы людей по этому показателю должны коррелировать с их участием в «экстремальных» видах деятельности, таких как катание на сноуборде и скалолазание, количеством полученных ими штрафов за превышение скорости и даже количеством переломов костей, которые они получили за эти годы. Критерии могут также включать другие меры той же конструкции. Например, можно было бы ожидать, что новые показатели тестовой тревожности или принятия физического риска будут положительно коррелировать с существующими показателями тех же конструктов. Таким образом, использование сходящихся операций является одним из способов проверки достоверности критерия.


Оценка достоверности критерия требует сбора данных с использованием меры. Исследователи Джон Качиоппо и Ричард Петти сделали это, когда создали свою шкалу самооценки потребности в познании, чтобы измерить, насколько люди ценят мышление и вовлечены в него (Cacioppo & Petty, 1982). Качиоппо, Дж. Т., и Петти, Р. Е. (1982). Потребность в познании. Журнал личности и социальной психологии, 42 , 116–131.В серии исследований они показали, что преподаватели колледжей набрали больше баллов, чем рабочие сборочного конвейера, что баллы людей положительно коррелировали с их баллами по стандартизированному тесту успеваемости и что их баллы отрицательно коррелировали с их баллами по показателю догматизма. (что представляет склонность к послушанию). За годы, прошедшие с момента ее создания, шкала потребности в познании использовалась буквально в сотнях исследований, и было показано, что она коррелирует с широким спектром других переменных, включая эффективность рекламы, интерес к политике и решения присяжных. (Петти, Бриньоль, Лёрш и Маккаслин, 2009 г.). Петти, Р. Э., Бриньоль, П., Лёрш, К., и Маккаслин, М. Дж. (2009). Потребность в познании. В MR Leary & RH Hoyle (Eds.),Справочник по индивидуальным различиям в социальном поведении (стр. 318–329). Нью-Йорк, штат Нью-Йорк: Guilford Press.


Дискриминантная валидность

Дискриминантная валидность — это степень, в которой оценки меры не коррелируют с мерами переменных, которые концептуально различны. Например, самооценка — это общее отношение к себе, которое довольно стабильно во времени. Это не то же самое, что настроение, то есть то, насколько хорошо или плохо человек себя чувствует в данный момент. Таким образом, оценки людей по новому показателю самооценки не должны сильно коррелировать с их настроением. Если бы новая мера самооценки была сильно коррелирована с мерой настроения, можно было бы утверждать, что новая мера на самом деле не измеряет самооценку; вместо этого он измеряет настроение.


Когда они создали шкалу потребности в познании, Качиоппо и Петти также представили доказательства дискриминантной валидности, показав, что баллы людей не коррелируют с некоторыми другими переменными. Например, они обнаружили лишь слабую корреляцию между потребностью людей в познании и мерой их когнитивного стиля — степенью, в которой они склонны мыслить аналитически, разбивая идеи на более мелкие части или целостно с точки зрения «большой картины». Они также не обнаружили корреляции между потребностью людей в познании и показателями их тестовой тревожности и их тенденцией реагировать социально желательными способами. Все эти низкие корреляции свидетельствуют о том, что показатель отражает концептуально отличный конструкт.


КЛЮЧЕВЫЕ ВЫВОДЫ

Исследователи-психологи не просто предполагают, что их измерения работают. Вместо этого они проводят исследования, чтобы показать, что они работают. Если они не могут показать, что они работают, они перестают их использовать.

Есть два различных критерия, по которым исследователи оценивают свои измерения: надежность и валидность. Надежность — это согласованность во времени (надежность при повторном тестировании), между элементами (внутренняя согласованность) и между исследователями (надежность между разными группами). Валидность - это степень, в которой оценки действительно представляют переменную, для которой они предназначены.

Обоснованность – это суждение, основанное на различных видах доказательств. Соответствующее свидетельство включает в себя надежность меры, охватывает ли она интересующую конструкцию и коррелируют ли получаемые ею оценки с другими переменными, с которыми они должны коррелировать, и не коррелируют с переменными, которые концептуально различны.

Надежность и валидность меры определяется не каким-либо одним исследованием, а последовательностью результатов нескольких исследований. Оценка надежности и валидности является непрерывным процессом.

УПРАЖНЕНИЯ

Практика: попросите нескольких друзей заполнить шкалу самооценки Розенберга. Затем оцените его внутреннюю согласованность, построив диаграмму рассеяния, чтобы показать корреляцию разделения пополам (четные и нечетные элементы). Вычислите также r Пирсона, если знаете как.

Обсуждение: Вспомните последний экзамен в колледже, который вы сдавали, и подумайте об экзамене как о психологической мере. Как вы думаете, для измерения какой конструкции он предназначался? Прокомментируйте его внешний вид и действительность содержания. Какие данные вы могли бы собрать, чтобы оценить его надежность, валидность критериев и дискриминантную валидность?

Практика: пройдите тест на имплицитную ассоциацию, а затем перечислите как можно больше способов оценки достоверности его критерия.

5.3 Практические стратегии психологического измерения

ЦЕЛИ ОБУЧЕНИЯ

Укажите четыре основных шага в процессе измерения.

Объясните, как вы решите, использовать ли существующую меру или создать свою собственную.

Опишите несколько стратегий для выявления и локализации существующих показателей психологических конструктов.

Опишите несколько общих принципов создания новых мер и реализации существующих и новых мер.

Создайте простой план для оценки надежности и достоверности существующей или новой меры.

До сих пор в этой главе мы рассмотрели несколько основных идей о природе психологических конструктов и их измерении. Но теперь представьте, что вам действительно нужно измерить психологический конструкт для исследовательского проекта. Как поступить? Вообще говоря, процесс измерения состоит из четырех этапов: (а) концептуальное определение конструкции, (б) функциональное определение конструкции, (в) реализация меры и (г) оценка меры. В этом разделе мы рассмотрим каждый из этих шагов по очереди.


Концептуальное определение конструкции

Наличие четкого и полного концептуального определения конструкта является предпосылкой для хорошего измерения. Во-первых, это позволяет вам принимать обоснованные решения о том, как именно измерять конструкцию. Если бы у вас было лишь смутное представление о том, что вы хотите измерить «память» людей, например, у вас не было бы способа выбрать, должны ли они запоминать список слов из словаря, набор фотографий, недавно выученный навык или опыт давно минувших дней. Поскольку сейчас психологи рассматривают память как набор полунезависимых систем, вам следует уточнить, что вы подразумеваете под «памятью». Если вы заинтересованы в долговременной декларативной памяти (памяти на факты), то имеет смысл, если участники запомнят список слов, которые они выучили на прошлой неделе, но не запомнят и отработают только что выученный навык.


Принятие решения об операционном определении

Использование существующей меры

Обычно хорошей идеей является использование существующей меры, которая успешно использовалась в предыдущих исследованиях. К числу преимуществ относятся следующие: (а) вы экономите время и силы на создании собственной, (б) уже есть некоторые доказательства того, что мера действительна (если она успешно использовалась), и (в) ваши результаты могут быть легко обработаны. сравнивать и комбинировать с предыдущими результатами. На самом деле, если уже существует надежная и валидная мера конструкта, другие исследователи могут ожидать, что вы будете его использовать, если только у вас нет веских и четко сформулированных причин этого не делать.


Если вы решите использовать существующую меру, вам все равно придется выбирать из нескольких альтернатив. Вы можете выбрать наиболее распространенный, тот, который лучше всего свидетельствует о надежности и валидности, тот, который лучше всего измеряет конкретный аспект интересующей вас конструкции (например, физиологическую меру стресса, если вас больше всего интересует его лежащей в основе физиологии), или даже тот, который проще всего использовать. Например, личностный опросник с десятью элементами (TIPI) представляет собой анкету для самоотчетов, которая измеряет все личностные параметры Большой пятерки всего с 10 элементами (Gosling, Rentfrow, & Swann, 2003). Гослинг, С.Д., Рентфроу, П.Дж., и Суонн, В.Б., младший (2003). Очень краткая оценка личностных областей Большой пятерки. Журнал исследований личности, 37 , 504–528.Он не так надежен или действителен, как более длительные и комплексные меры, но исследователь может использовать его, когда время тестирования сильно ограничено.


Когда существующая мера была создана в первую очередь для использования в научных исследованиях, она обычно подробно описывается в опубликованной исследовательской статье и может свободно использоваться в ваших собственных исследованиях — с надлежащим цитированием. Вы можете обнаружить, что более поздние исследователи, использующие ту же меру, описывают ее лишь кратко, но дают ссылку на исходную статью, и в этом случае вам придется получить подробности из исходной статьи. Американская психологическая ассоциация также публикует Справочник неопубликованных экспериментальных измерений., который представляет собой обширный каталог мер, которые использовались в предыдущих исследованиях. Многие существующие меры, особенно те, которые применяются в клинической психологии, являются собственностью. Это означает, что права на них принадлежат издателю, и вам придется их приобрести. К ним относятся многие стандартные тесты интеллекта, опросник депрессии Бека и Миннесотский многофазный опросник личности (MMPI). Подробную информацию о многих из этих показателей и о том, как их получить, можно найти в других справочниках, включая « Тесты в печати » и « Ежегодник умственных измерений» . Скорее всего, вы сможете найти эти справочники в библиотеке своего колледжа или университета.


Создание собственной меры

Вместо использования существующей меры вы можете создать свою собственную. Возможно, нет существующей меры интересующей вас конструкции или существующие слишком сложны или требуют много времени для использования. Или, возможно, вы хотите использовать новую меру специально, чтобы увидеть, работает ли она так же, как существующие меры, то есть для демонстрации сходящихся операций. В этом разделе мы рассмотрим некоторые общие вопросы создания новых показателей, которые в равной степени применимы к самоотчетам, поведенческим и физиологическим показателям. Более подробные рекомендации по созданию показателей самоотчета представлены в Главе 9 «Исследования в рамках опроса» .


Во-первых, имейте в виду, что большинство новых мер в психологии на самом деле являются вариациями существующих мер, поэтому вам все равно следует искать идеи в исследовательской литературе. Возможно, вы сможете изменить существующий вопросник, создать бумажно-карандашную версию показателя, который обычно компьютеризируется (или наоборот), или адаптировать показатель, который традиционно использовался для другой цели. Например, знаменитая задача Струпа (Stroop, 1935) Stroop, JR (1935). Исследования вмешательства в серийных словесных реакций. Журнал экспериментальной психологии, 18 , 643–662.— в котором люди быстро называют цвета, которыми напечатаны различные цветные слова, — был адаптирован для изучения социальной тревожности. Социально тревожные люди медленнее называют цвета, когда слова имеют негативные социальные коннотации, такие как «глупый» (Amir, Freshman, & Foa, 2002). Амир, Н., Фрешман, М., и Фоа, Э. (2002). Улучшено вмешательство Stroop для угрозы при социальной фобии. Журнал тревожных расстройств, 16 , 1–9.


При создании новой меры следует стремиться к простоте. Помните, что ваши участники не так заинтересованы в вашем исследовании, как вы, и что они будут сильно различаться по своей способности понимать и выполнять любое задание, которое вы им поручите. Вы должны создать набор четких инструкций, используя простой язык, который вы можете представить в письменной форме или прочитать вслух (или и то, и другое). Также рекомендуется включить один или несколько практических элементов, чтобы участники могли ознакомиться с заданием, и предусмотреть для них возможность задавать вопросы, прежде чем продолжить. Также лучше, чтобы измерение было кратким, чтобы избежать утомления или разочарования ваших участников до такой степени, что их ответы начинают становиться менее надежными и достоверными.


Однако потребность в краткости необходимо сопоставлять с тем фактом, что почти всегда лучше, чтобы мера включала несколько элементов, а не один элемент. Этому есть две причины. Один из них касается достоверности содержания. Для адекватного покрытия конструкции часто требуется несколько элементов. Другое дело надежность. На реакцию людей на отдельные вопросы могут влиять всевозможные не относящиеся к делу факторы — непонимание конкретного вопроса, кратковременное отвлечение внимания или простая ошибка, например выбор неверного варианта ответа. Но когда несколько ответов суммируются или усредняются, эффекты этих нерелевантных факторов, как правило, уравновешивают друг друга, чтобы получить более надежные оценки. Помните, однако, что несколько элементов должны быть структурированы таким образом, чтобы их можно было объединить в единую общую оценку путем суммирования или усреднения. Чтобы измерить «финансовую ответственность», студент может спросить людей об их годовом доходе, узнать их кредитный рейтинг и попросить их оценить, насколько они «бережливы», но нет очевидного способа объединить эти ответы в общий балл. Чтобы создать настоящую оценку из нескольких пунктов, учащийся может вместо этого попросить людей оценить степень, в которой 10 утверждений о финансовой ответственности описывают их по одной и той же пятибалльной шкале.


Наконец, лучший способ удостовериться в том, что ваше измерение имеет четкие инструкции, включает в себя достаточную практику и имеет подходящую длину, — это протестировать нескольких человек. (Семья и друзья часто прекрасно служат этой цели). Наблюдайте за тем, как они выполняют задание, засекайте время и попросите их потом прокомментировать, насколько это было легко или сложно, были ли ясны инструкции и что-нибудь еще, что вас может интересовать. Очевидно, что лучше выявить проблемы с мерой, прежде чем начинать какой-либо крупномасштабный сбор данных.


Реализация меры

Вы захотите реализовать любую меру таким образом, чтобы максимизировать ее надежность и достоверность. В большинстве случаев лучше тестировать всех в одинаковых условиях, в идеале — в тишине и без отвлекающих факторов. Тестирование участников в группах часто проводится, потому что это эффективно, но имейте в виду, что оно может отвлекать внимание, что снижает надежность и достоверность измерения. Как всегда, полезно использовать предыдущие исследования в качестве руководства. Если другие успешно протестировали людей в группах с использованием определенной меры, то вам также следует подумать о том, чтобы сделать это.


Имейте также в виду, что люди могут по-разному реагировать на измерения, что снижает надежность и достоверность оценок. Хотя некоторые неприятные участники могут намеренно реагировать таким образом, чтобы «испортить» исследование, реакция участников , скорее всего, примет противоположную форму. Приятные участники могут реагировать так, как, по их мнению, от них ожидают. Они могут участвовать в социально желательном реагировании . Например, люди с низкой самооценкой соглашаются с тем, что они чувствуют себя достойными людьми не потому, что они действительно так считают, а потому, что они считают это социально приемлемой реакцией и не хотят выглядеть плохо в глазах исследователя. Кроме того, исследования могут иметь встроенные характеристики спроса.: намеки на то, как исследователь ожидает поведения участников. Например, участница, чье отношение к физическим упражнениям измеряется сразу после того, как ее попросили прочитать отрывок об опасностях сердечно-сосудистых заболеваний, может обоснованно заключить, что этот отрывок предназначен для улучшения ее отношения. В результате она может отреагировать более благосклонно, потому что считает, что исследователь ожидает от нее этого. Наконец, ваши собственные ожидания могут непреднамеренно повлиять на поведение участников.


Есть несколько мер предосторожности, которые вы можете предпринять, чтобы свести к минимуму такие реакции. Во-первых, сделать процедуру как можно более ясной и краткой, чтобы у участников не возникло соблазна выразить свое недовольство вашими результатами. Другой — гарантировать анонимность участников и дать им понять, что вы это делаете. Если вы тестируете их в группах, убедитесь, что они сидят достаточно далеко друг от друга и не могут видеть ответы друг друга. Дайте им всем одинаковые письменные принадлежности, чтобы их нельзя было узнать, например, по розовой блестящей ручке, которой они пользовались. Вы даже можете разрешить им запечатывать заполненные анкеты в отдельные конверты или помещать их в почтовый ящик, где они сразу же смешиваются с анкетами других пользователей. Хотя информированное согласие требует сообщить участникам, что они будут делать, он не требует раскрытия вашей гипотезы или другой информации, которая может подсказать участникам, какой реакции вы ожидаете от них. Опросник, предназначенный для измерения финансовой ответственности, не обязательно должен называться «Отвечаете ли вы в финансовом отношении?» Он может называться «Опросник денег» или вообще не иметь названия. Наконец, последствия ваших ожиданий можно свести к минимуму, организовав проведение измерения помощником, который не знает ни его намерения, ни проверяемой гипотезы. Независимо от того, возможно ли это, вы должны стандартизировать все взаимодействия между исследователями и участниками — например, всегда читая один и тот же набор инструкций слово в слово. Опросник, предназначенный для измерения финансовой ответственности, не обязательно должен называться «Отвечаете ли вы в финансовом отношении?» Он может называться «Опросник денег» или вообще не иметь названия. Наконец, последствия ваших ожиданий можно свести к минимуму, организовав проведение измерения помощником, который не знает ни его намерения, ни проверяемой гипотезы. Независимо от того, возможно ли это, вы должны стандартизировать все взаимодействия между исследователями и участниками — например, всегда читая один и тот же набор инструкций слово в слово. Опросник, предназначенный для измерения финансовой ответственности, не обязательно должен называться «Отвечаете ли вы в финансовом отношении?» Он может называться «Опросник денег» или вообще не иметь названия. Наконец, последствия ваших ожиданий можно свести к минимуму, организовав проведение измерения помощником, который не знает ни его намерения, ни проверяемой гипотезы. Независимо от того, возможно ли это, вы должны стандартизировать все взаимодействия между исследователями и участниками — например, всегда читая один и тот же набор инструкций слово в слово.


Оценка меры

После того, как вы использовали свою меру на выборке людей и получили набор баллов, вы можете более тщательно оценить ее с точки зрения надежности и достоверности. Даже если эта мера широко использовалась другими исследователями и уже продемонстрировала надежность и валидность, вы не должны предполагать, что она сработала так, как ожидалось, для вашего конкретного образца и в ваших конкретных условиях тестирования. Как бы то ни было, теперь у вас есть дополнительные доказательства надежности и валидности измерения, и было бы разумно добавить эти доказательства в исследовательскую литературу.


В большинстве дизайнов исследований невозможно оценить надежность повторного тестирования, поскольку участников тестируют только один раз. В качестве новой меры вы можете разработать исследование специально для оценки его надежности при повторном тестировании путем двухкратного тестирования одной и той же группы участников. В других случаях исследование, предназначенное для ответа на другой вопрос, все же позволяет оценить надежность повторного тестирования. Например, преподаватель психологии может измерить отношение своих студентов к критическому мышлению, используя одну и ту же меру в начале и в конце семестра, чтобы увидеть, есть ли какие-либо изменения. Даже если изменений не будет, он все равно может посмотреть на корреляцию между оценками студентов в два раза, чтобы оценить надежность измерения при повторном тестировании.


Критериальную и дискриминантную валидность можно оценивать различными способами. Например, если ваше исследование включало более одного показателя одного и того же конструкта или показателей концептуально различных конструктов, вам следует изучить корреляции между этими показателями, чтобы убедиться, что они соответствуют вашим ожиданиям. Обратите также внимание на то, что успешная экспериментальная манипуляция также свидетельствует о достоверности критерия. Напомним, что Макдональд и Мартино манипулировали настроением участников, заставляя их думать либо о положительных, либо о отрицательных мыслях, и после манипулирования их измерение настроения показало отчетливую разницу между двумя группами. Это одновременно свидетельствовало о том, что их манипуляции с настроением сработали и что их оценка настроения была достоверной.


Но что, если ваши недавно собранные данные ставят под сомнение надежность или достоверность вашей меры? Короткий ответ заключается в том, что вы должны спросить, почему. Возможно, что-то не так с вашей мерой или с тем, как вы ее применяли. Возможно, что-то не так с вашим концептуальным определением. Возможно, ваша экспериментальная манипуляция не удалась. Например, если измерение настроения не показало никакой разницы между людьми, которым вы дали указание мыслить позитивно и негативно, возможно, это связано с тем, что участники на самом деле думали не так, как предполагалось, или что эти мысли на самом деле не влияли на их настроение. Короче говоря, нужно «вернуться к чертежной доске», чтобы пересмотреть меру, пересмотреть концептуальное определение или попробовать новую манипуляцию.


КЛЮЧЕВЫЕ ВЫВОДЫ

Хорошее измерение начинается с четкого концептуального определения измеряемого конструкта. Это достигается как ясным и детальным мышлением, так и обзором исследовательской литературы.

Часто у вас есть возможность использовать существующую меру или создать новую меру. Вы должны принять это решение, исходя из наличия существующих мер и их адекватности для ваших целей.

Можно предпринять несколько простых шагов для создания новых мер и для реализации как существующих, так и новых мер, которые могут помочь максимизировать надежность и достоверность.

После того, как вы использовали меру, вы должны переоценить ее надежность и достоверность на основе ваших новых данных. Помните, что оценка надежности и валидности — это непрерывный процесс.

УПРАЖНЕНИЯ

Практика: напишите свое собственное концептуальное определение уверенности в себе, раздражительности и атлетизма.

Практика: выберите конструкт (сексуальная ревность, уверенность в себе и т. д.) и найдите два показателя этого конструкта в исследовательской литературе. Если бы вы проводили собственное исследование, какое из них (если бы использовали) вы бы использовали и почему?





Экспериментальное исследование

В конце 1960-х социальные психологи Джон Дарли и Бибб Латане выдвинули контринтуитивную гипотезу. Чем больше свидетелей несчастного случая или преступления, тем меньше вероятность того, что кто-либо из них поможет пострадавшему (Darley & Latané, 1968). Дарли, Дж. М., и Латане, Б. (1968). Вмешательство свидетелей в чрезвычайных ситуациях: Распределение ответственности. Журнал личности и социальной психологии, 4 , 377–383.Они также выдвинули теорию о том, что это происходит потому, что каждый свидетель чувствует меньшую ответственность за помощь — процесс, называемый «распределением ответственности». Дарли и Латане отметили, что их идеи согласуются со многими реальными случаями. Например, женщина из Нью-Йорка по имени Китти Дженовезе подверглась нападению и была убита, а несколько свидетелей не смогли помочь. Но Дарли и Латане также понимали, что такие отдельные случаи не дают убедительных доказательств предполагаемого ими «эффекта свидетеля». Например, невозможно было узнать, помог бы кто-нибудь из свидетелей убийства Китти Дженовезе, если бы их было меньше.


Итак, чтобы проверить свою гипотезу, Дарли и Латане создали в лаборатории смоделированную чрезвычайную ситуацию. Каждого из их студентов-участников колледжа изолировали в небольшой комнате и сказали, что он или она будут обсуждать жизнь колледжа с другими студентами через систему внутренней связи. Однако в начале обсуждения у одного из студентов начался приступ эпилепсии. По интеркому прозвучало следующее: «Мне действительно-э-э-необходима помощь, так что если кто-то-э-э-окажет мне ч-помощ-э-э-э-э-э-э-э-э-э-э-э-э-э-э-э-э-э-э-м-не мог бы кто-то-э-э- Er-Help-er-uh-uh-uh (задыхающиеся звуки) ... Я умру-эр-эр-я ... ]» (Дарли и Латане, 1968, стр. 379). Дарли, Дж. М., и Латане, Б. (1968). Вмешательство свидетелей в чрезвычайных ситуациях: Распределение ответственности.Журнал личности и социальной психологии, 4 , 377–383.


На самом деле других студентов не было. Эти комментарии были предварительно записаны и воспроизведены, чтобы создать видимость реальной чрезвычайной ситуации. Ключом к исследованию было то, что некоторым участникам сказали, что в обсуждении участвовал только один студент (жертва), другим сказали, что в нем участвовали два других студента, а третьим сказали, что в нем участвовали еще пять студентов. Поскольку это было единственным различием между этими тремя группами участников, любое различие в их стремлении помочь жертве должно было быть вызвано этим. И действительно, вероятность того, что участник вышел из комнаты, чтобы обратиться за помощью к «жертве», уменьшилась с 85% до 62% и 31% по мере увеличения числа «свидетелей».


Притча о 38 свидетелях

История Китти Дженовезе была рассказана и пересказана во многих учебниках по психологии. Стандартная версия состоит в том, что свидетелей преступления было 38 человек, все они наблюдали (или слушали) в течение длительного периода времени, и никто из них ничем не помог. Однако недавние исследования показывают, что стандартная история во многих отношениях неточна (Manning, Levine, & Collins, 2007). Мэннинг, Р., Левин, М., и Коллинз, А. (2007). Убийство Китти Дженовезе и социальная психология оказания помощи: притча о 38 свидетелях. Американский психолог, стр. 62 , 555–562.Например, на суде дали показания только шесть очевидцев, ни один из них не знал, что он или она были свидетелями нападения со смертельным исходом, и было несколько сообщений о том, что свидетели звонили в полицию или даже приходили на помощь Китти Дженовезе. Хотя стандартная история вдохновила целую серию исследований эффекта свидетеля и распределения ответственности, она, возможно, также отвлекла внимание исследователей и студентов от других не менее интересных и важных вопросов психологии помощи, включая условия, в которых на самом деле люди коллективно реагируют на чрезвычайные ситуации.


Исследование, которое провели Дарли и Латане, было исследованием особого рода, называемым экспериментом. Эксперименты используются для определения не только того, существует ли статистическая связь между двумя переменными, но также и того, является ли эта связь причинно-следственной. По этой причине эксперименты являются одним из наиболее распространенных и полезных инструментов в арсенале психолога-исследователя. В этой главе мы подробно рассмотрим эксперименты. Сначала мы рассмотрим, что отличает эксперименты от других видов исследований и почему они подтверждают причинно-следственные выводы, а другие виды исследований — нет. Затем мы рассмотрим два основных способа планирования эксперимента — между испытуемыми и внутри испытуемых — и обсудим их плюсы и минусы. Наконец, рассмотрим несколько важных практических вопросов, возникающих при проведении экспериментов.


6.1 Основы эксперимента

ЦЕЛИ ОБУЧЕНИЯ

Объясните, что такое эксперимент, и определите примеры исследований, которые являются экспериментами, и исследований, которые не являются экспериментами.

Объясните, что такое внутренняя валидность и почему считается, что эксперименты обладают высокой внутренней валидностью.

Объясните, что такое внешняя валидность, и оцените исследования с точки зрения их внешней валидности.

Проведите различие между манипулированием независимой переменной и управлением посторонними переменными и объясните важность каждой из них.

Распознайте примеры смешанных переменных и объясните, как они влияют на внутреннюю валидность исследования.

Что такое эксперимент?

Как мы видели ранее в книге, эксперимент — это тип исследования, специально предназначенный для ответа на вопрос, существует ли причинно-следственная связь между двумя переменными. Вызывают ли изменения в независимой переменнойизменения зависимой переменной? Эксперименты имеют две основные особенности. Во-первых, исследователи манипулируют или систематически изменяют уровень независимой переменной. Различные уровни независимой переменной называются условиями. Например, в эксперименте Дарли и Латане независимой переменной было количество свидетелей, которые, по мнению участников, присутствовали. Исследователи манипулировали этой независимой переменной, сообщая участникам, что в обсуждении участвовали один, два или пять других студентов, тем самым создавая три условия. Вторая фундаментальная особенность эксперимента заключается в том, что исследователь контролирует или минимизирует изменчивость переменных, отличных от независимой и зависимой переменных. Эти другие переменные называются внешними переменными. Дарли и Латане проверили всех своих участников в одной комнате, подвергли их одной и той же чрезвычайной ситуации и так далее. Они также случайным образом распределили своих участников по условиям, чтобы три группы были похожи друг на друга с самого начала. Обратите внимание, что хотя словаманипулирование и контроль имеют схожие значения в повседневном языке, исследователи проводят между ними четкое различие. Они манипулируют независимой переменной, систематически изменяя ее уровни, и контролируют другие переменные, поддерживая их постоянными.


Внутренняя и внешняя валидность

Внутренняя валидность

Напомним, что тот факт, что две переменные статистически связаны, не обязательно означает, что одна является причиной другой. «Корреляция не подразумевает причинно-следственной связи». Например, если бы люди, которые регулярно занимаются спортом, были счастливее тех, кто не занимается спортом регулярно, это не обязательно означало бы, что занятия спортом повышают уровень счастья людей. Вместо этого это может означать, что большее счастье заставляет людей заниматься спортом (проблема направленности) или что что-то вроде улучшения физического здоровья заставляет людей заниматься спортом и быть счастливее (проблема третьей переменной).


Цель эксперимента, однако, состоит в том, чтобы показать, что две переменные статистически связаны, и сделать это таким образом, чтобы подтвердить вывод о том, что независимая переменная вызвала любые наблюдаемые различия в зависимой переменной. Основная логика такова: если исследователь создает два или более очень похожих условия, а затем манипулирует независимой переменной, чтобы получить только одно различие между ними, то любое последующее различие между условиями должно быть вызвано независимой переменной. Например, поскольку единственное различие между условиями Дарли и Латане заключалось в количестве студентов, которые, по мнению участников, были вовлечены в обсуждение, это должно было быть причиной различий в помощи между условиями.


Считается, что эмпирическое исследование имеет высокую внутреннюю валидность , если способ его проведения подтверждает вывод о том, что независимая переменная вызвала любые наблюдаемые различия в зависимой переменной. Таким образом, эксперименты обладают высокой внутренней валидностью, потому что способ их проведения — с манипулированием независимой переменной и контролем посторонних переменных — обеспечивает сильную поддержку причинно-следственных выводов.


Внешняя валидность

В то же время то, как проводятся эксперименты, иногда вызывает разного рода критику. В частности, необходимость манипулировать независимой переменной и контролировать посторонние переменные означает, что эксперименты часто проводятся в условиях, которые кажутся искусственными или непохожими на «реальную жизнь» (Станович, 2010). Станович, К.Е. (2010). Как правильно думать о психологии (9-е изд.). Бостон, Массачусетс: Аллин и Бэкон.Во многих психологических экспериментах все участники — студенты колледжей, которые приходят в аудиторию или лабораторию, чтобы заполнить серию бумажных и карандашных вопросников или выполнить тщательно разработанное компьютерное задание. Рассмотрим, например, эксперимент, в котором исследователь Барбара Фредриксон и ее коллеги попросили студентов колледжа прийти в лабораторию на территории кампуса и выполнить тест по математике в купальниках (Fredrickson, Roberts, Noll, Quinn, & Twenge, 1998). Фредриксон, Б.Л., Робертс, Т.-А., Нолл, С.М., Куинн, Д.М., и Твенге, Дж.М. (1998). Купальник становится вами: половые различия в самообъективации, воздержании от еды и математических способностях. Журнал личности и социальной психологии, 75 , 269–284.Поначалу это может показаться глупым. Когда студенты колледжа когда-нибудь должны будут выполнять тесты по математике в купальниках помимо этого эксперимента?


Перед нами стоит проблема внешней валидности. Эмпирическое исследование имеет высокую внешнюю валидностьесли способ его проведения позволяет обобщать результаты на людей и ситуации, выходящие за рамки реально изученных. Как правило, исследования имеют более высокую внешнюю валидность, когда участники и изучаемая ситуация подобны тем, на которые исследователи хотят обобщить. Представьте, например, что группу исследователей интересует, как на покупателей в крупных продуктовых магазинах влияет то, упакованы ли хлопья для завтрака в желтые или фиолетовые коробки. Их исследование имело бы высокую внешнюю валидность, если бы они изучали решения обычных людей, совершающих еженедельные покупки в реальном продуктовом магазине. Если бы покупатели купили намного больше хлопьев в фиолетовых коробках, исследователи были бы вполне уверены, что это верно и для других покупателей в других магазинах. Однако их исследование будет иметь относительно низкую внешнюю валидность. если бы они изучали выборку студентов колледжа в лаборатории избранного колледжа, которые просто оценивали привлекательность различных цветов, представленных на экране компьютера. Если бы студенты сочли фиолетовый цвет более привлекательным, чем желтый, исследователи не были бы уверены, что это имеет отношение к решениям покупателей о покупке хлопьев.


Однако мы должны быть осторожны, чтобы не сделать опрометчивого вывода, что эксперименты имеют низкую внешнюю валидность. Одна из причин заключается в том, что эксперименты не должны казаться искусственными. Учтите, что эксперимент Дарли и Латане обеспечил достаточно хорошую симуляцию реальной чрезвычайной ситуации. Или рассмотрим полевые эксперименты , которые проводятся полностью за пределами лаборатории. В одном из таких экспериментов Роберт Чалдини и его коллеги изучали, предпочитают ли гости отеля повторно использовать свои полотенца в течение второго дня, а не стирать их в целях экономии воды и энергии (Cialdini, 2005). Чалдини, Р. (2005 г., апрель). Не сдавайтесь: используйте исследования социального влияния. Наблюдатель АПС . Извлекаются изhttp://www.psychologicalscience.org/observer/getArticle.cfm?id=1762 Эти исследователи манипулировали сообщением на карточке, оставленной в большом количестве гостиничных номеров. В одной версии сообщения подчеркивалось уважение к окружающей среде, в другой подчеркивалось, что отель пожертвует часть своих сбережений на экологические цели, а в третьей подчеркивалось, что большинство гостей отеля предпочитают повторно использовать свои полотенца. В результате гости, получившие сообщение о том, что большинство постояльцев отеля предпочитают повторно использовать свои полотенца, повторно использовали свои собственные полотенца значительно чаще, чем гости, получившие любое из двух других сообщений. Учитывая то, как они провели свое исследование, весьма вероятно, что их результаты будут справедливы и для других гостей в других отелях.


Вторая причина не делать опрометчивого вывода о низкой внешней валидности экспериментов заключается в том, что они часто проводятся для изучения психологических процессов .которые, вероятно, будут действовать в отношении различных людей и ситуаций. Вернемся к эксперименту Фредриксона и его коллег. Они обнаружили, что женщины в их исследовании, но не мужчины, хуже справлялись с тестом по математике, когда были в купальниках. Они утверждали, что это произошло из-за большей склонности женщин объективировать себя - думать о себе с точки зрения стороннего наблюдателя, что отвлекает их внимание от других задач. Более того, они утверждали, что этот процесс самообъективации и его влияние на внимание, вероятно, проявляются у самых разных женщин и ситуаций, даже если ни одна из них никогда не окажется на контрольной по математике в купальнике.


Манипуляции с независимой переменной

Опять же, манипулировать независимой переменной означает систематически изменять ее уровень, чтобы разные группы участников подвергались воздействию разных уровней этой переменной или одна и та же группа участников подвергалась воздействию разных уровней в разное время. Например, чтобы увидеть, влияет ли экспрессивное письмо на здоровье людей, исследователь может поручить некоторым участникам писать о травматических переживаниях, а другим — о нейтральных переживаниях. Различные уровни независимой переменной называются условиями , и исследователи часто дают состояниям короткие описательные имена, чтобы о них было легко говорить и писать. В этом случае состояния можно назвать «травматическим состоянием» и «нейтральным состоянием».


Обратите внимание, что манипулирование независимой переменной должно включать активное вмешательство исследователя. Сравнение групп людей, различающихся по независимой переменной, до начала исследования — это не то же самое, что манипулирование этой переменной. Например, исследователь, который сравнивает здоровье людей, которые уже ведут дневник, со здоровьем людей, которые не ведут дневник, не манипулировал этой переменной и, следовательно, не проводил эксперимент. Это важно, потому что группы, которые уже различаются по одному признаку в начале исследования, скорее всего, будут различаться и по другим признакам. Например, люди, которые предпочитают вести дневники, также могут быть более добросовестными, более интровертными или менее подверженными стрессу, чем люди, которые этого не делают. Следовательно, любая наблюдаемая разница между двумя группами с точки зрения их здоровья могла быть вызвана тем, ведут ли они дневник или нет, или могла быть вызвана любыми другими различиями между людьми, которые ведут дневники и не ведут их. Таким образом, активное манипулирование независимой переменной имеет решающее значение для устранения проблемы с третьей переменной.


Конечно, во многих ситуациях независимой переменной нельзя манипулировать по практическим или этическим соображениям, и поэтому эксперимент невозможен. Например, нельзя манипулировать тем, имеют ли люди значительный опыт раннего заболевания или нет, что делает невозможным проведение эксперимента по влиянию раннего опыта болезни на развитие ипохондрии. Это не означает, что невозможно изучить взаимосвязь между ранними переживаниями болезни и ипохондрией — только то, что это должно быть сделано с использованием неэкспериментальных подходов. Мы обсудим это подробно позже в книге.


Во многих экспериментах независимая переменная является конструкцией, которой можно манипулировать только косвенно. Например, исследователь может попытаться косвенно манипулировать уровнем стресса участников, говоря некоторым из них, что у них есть пять минут, чтобы подготовить короткую речь, которую они затем должны будут произнести перед аудиторией других участников. В таких ситуациях исследователи часто включают в свою процедуру проверку на манипулирование. Проверка манипуляции — это отдельная мера конструкции, которой исследователь пытается манипулировать. Например, исследователи, пытающиеся манипулировать уровнем стресса участников, могут дать им бумажный опросник или измерить их кровяное давление — возможно, сразу после манипуляции или в конце процедуры — чтобы убедиться, что они успешно манипулировали этой переменной.


Контроль посторонних переменных

Внешняя переменнаяэто все, что меняется в контексте исследования, кроме независимых и зависимых переменных. В эксперименте по влиянию выразительного письма на здоровье, например, внешние переменные будут включать переменные участников (индивидуальные различия), такие как их способность писать, их диета и размер их обуви. Они также будут включать переменные ситуации или задачи, такие как время суток, когда участники пишут, пишут ли они от руки или на компьютере, а также погода. Посторонние переменные создают проблему, потому что многие из них могут иметь некоторое влияние на зависимую переменную. Например, на здоровье участников будут влиять многие другие факторы, помимо того, занимаются ли они экспрессивным письмом или нет. Это может затруднить отделение влияния независимой переменной от влияния посторонних переменных,контролировать посторонние переменные, удерживая их постоянными.


Посторонние переменные как «шум»

Посторонние переменные затрудняют обнаружение влияния независимой переменной двумя способами. Один из них заключается в добавлении к данным изменчивости или «шума». Представьте себе простой эксперимент по влиянию настроения (счастливого или грустного) на количество счастливых детских событий, которые люди могут вспомнить. Участников настраивают на негативное или позитивное настроение (показывая им счастливый или грустный видеоклип), а затем просят вспомнить как можно больше счастливых событий из детства. Два крайних левых столбца таблицы 6.1 «Гипотетические данные без шума и реальные данные с шумом»показать, как могли бы выглядеть данные, если бы не было посторонних переменных, а количество воспоминаний участников о счастливых детских событиях зависело только от их настроения. Каждый участник в состоянии счастливого настроения вспомнил ровно четыре счастливых события детства, а каждый участник в состоянии грустного настроения вспомнил ровно три. Влияние настроения здесь совершенно очевидно. В действительности, однако, данные, вероятно, больше походили бы на данные в двух крайних правых столбцах таблицы 6.1 «Гипотетические данные без шума и реальные данные с шумом» .. Даже в состоянии хорошего настроения некоторые участники будут вспоминать меньше счастливых воспоминаний, потому что у них меньше возможностей для рисования, они используют менее эффективные стратегии или менее мотивированы. И даже в состоянии грустного настроения некоторые участники вспоминали больше счастливых детских воспоминаний, потому что у них было больше счастливых воспоминаний, они использовали более эффективные стратегии вспоминания или были более мотивированы. Хотя средняя разница между двумя группами такая же, как и в идеализированных данных, эта разница гораздо менее очевидна в контексте большей изменчивости данных. Таким образом, одна из причин, по которой исследователи пытаются контролировать посторонние переменные, заключается в том, что их данные больше похожи на идеализированные данные в таблице 6.1 «Гипотетические данные без шума и реалистичные данные с шумом»., что облегчает обнаружение эффекта независимой переменной (хотя реальные данные никогда не выглядят так хорошо ).


Таблица 6.1 Гипотетические данные без шума и реальные данные с шумом


Идеализированные «бесшумные» данные Реалистичные «зашумленные» данные

Хорошее настроение Грустное настроение Хорошее настроение Грустное настроение

4 3 3 1

4 3 6 3

4 3 2 4

4 3 4 0

4 3 5 5

4 3 2 7

4 3 3 2

4 3 1 5

4 3 6 1

4 3 8 2

М = 4 М = 3 М = 4 М = 3

Один из способов контролировать внешние переменные — поддерживать их постоянными. Это может означать поддержание постоянными переменных ситуации или задачи путем тестирования всех участников в одном и том же месте, предоставления им одинаковых инструкций, одинакового обращения с ними и т. д. Это также может означать, что переменные участников остаются постоянными. Например, многие исследования языка ограничивают участников правшами, у которых языковые области обычно изолированы в левом полушарии мозга. У левшей более вероятно, что их языковые области изолированы в правом полушарии головного мозга или распределены по обоим полушариям, что может изменить способ обработки речи и, таким образом, добавить шум к данным.


В принципе, исследователи могут контролировать посторонние переменные, ограничивая участников одной очень конкретной категорией людей, например, 20-летними, гетеросексуалами, женщинами, правшами, второкурсниками, специализирующимися на психологии. Очевидным недостатком этого подхода является то, что он снизит внешнюю валидность исследования, в частности, степень, в которой результаты могут быть обобщены за пределами реально изучаемых людей. Например, может быть неясно, применимы ли результаты, полученные на выборке молодых гетеросексуальных женщин, к пожилым мужчинам-геям. Во многих ситуациях преимущества разнородной выборки перевешивают уменьшение шума, достигаемое однородной выборкой.


Внешние переменные как смешанные переменные

Второй способ, которым посторонние переменные могут затруднить обнаружение эффекта независимой переменной, заключается в том, что они становятся мешающими переменными. Вмешивающаяся переменная — это посторонняя переменная, которая различается в среднем поуровни независимой переменной. Например, почти во всех экспериментах коэффициенты интеллекта участников (IQ) будут посторонней переменной. Но пока есть участники с более низкими и более высокими IQ на каждом уровне независимой переменной, так что средний IQ примерно одинаков, тогда такая вариация, вероятно, приемлема (и может быть даже желательна). Однако было бы плохо, если бы участники на одном уровне независимой переменной имели в среднем значительно более низкий IQ, а участники на другом уровне имели бы в среднем значительно более высокий IQ. В этом случае IQ будет смешанной переменной.


Запутать означает запутать, и это именно то, что делают смешанные переменные. Поскольку они различаются в зависимости от условий — как и независимая переменная — они обеспечивают альтернативное объяснение любой наблюдаемой разницы в зависимой переменной. Рисунок 6.1 «Гипотетические результаты исследования влияния настроения на память»показаны результаты гипотетического исследования, в котором участники с хорошим настроением набрали больше баллов в задаче на память, чем участники с плохим настроением. Но если IQ является мешающей переменной — участники с положительным настроением имеют в среднем более высокий IQ, чем участники с отрицательным настроением, — тогда неясно, было ли положительное настроение или более высокий IQ причиной того, что участники с первым состоянием оценка выше. Один из способов избежать смешения переменных — оставить лишние переменные постоянными. Например, можно предотвратить превращение IQ в мешающую переменную, ограничив участников только теми, у кого IQ ровно 100. Но этот подход не всегда желателен по причинам, которые мы уже обсуждали.


Рис. 6.1 . Гипотетические результаты исследования влияния настроения на память



Поскольку IQ также различается в зависимости от условий, это смешанная переменная.


КЛЮЧЕВЫЕ ВЫВОДЫ

Эксперимент — это тип эмпирического исследования, которое включает в себя манипулирование независимой переменной, измерение зависимой переменной и контроль посторонних переменных.

Исследования имеют высокую внутреннюю валидность в той мере, в какой способ их проведения поддерживает вывод о том, что независимая переменная вызвала любые наблюдаемые различия в зависимой переменной. Эксперименты, как правило, имеют высокую внутреннюю достоверность из-за манипулирования независимой переменной и контроля внешних переменных.

Исследования имеют высокую внешнюю валидность в той мере, в какой результат можно обобщить на людей и ситуации, выходящие за рамки реально изучаемых. Хотя эксперименты могут показаться «искусственными» и малопривлекательными, важно учитывать, могут ли изучаемые психологические процессы проявляться в других людях и ситуациях.

УПРАЖНЕНИЯ

Практика: перечислите пять переменных, которыми исследователь может манипулировать в ходе эксперимента. Перечислите пять переменных, которыми исследователь не может манипулировать в ходе эксперимента.

Практика: Для каждой из следующих тем решите, можно ли изучать эту тему с помощью плана экспериментального исследования, и объясните, почему или почему нет.


Влияние повреждения теменной доли на способность людей выполнять основные арифметические действия.

Влияние клинической депрессии на количество близких друзей.

Влияние группового обучения на социальные навыки подростков с синдромом Аспергера.

Влияние платы людям за прохождение теста IQ на их результаты в этом тесте.

6.2 Экспериментальный план

ЦЕЛИ ОБУЧЕНИЯ

Объясните разницу между экспериментами между испытуемыми и внутри испытуемых, перечислите некоторые плюсы и минусы каждого подхода и решите, какой подход использовать для ответа на конкретный исследовательский вопрос.

Дайте определение случайному распределению, отличите его от случайной выборки, объясните его назначение в экспериментальных исследованиях и используйте несколько простых стратегий для его реализации.

Дайте определение контрольному состоянию, объясните его назначение в исследованиях эффективности лечения и опишите некоторые альтернативные типы контрольных условий.

Дайте определение нескольким типам эффекта переноса, приведите примеры каждого из них и объясните, как уравновешивание помогает справиться с ними.

В этом разделе мы рассмотрим несколько различных способов планирования эксперимента. Основное различие, которое мы проведем, будет между подходами, в которых каждый участник сталкивается с одним уровнем независимой переменной, и подходами, в которых каждый участник сталкивается со всеми уровнями независимой переменной. Первые называются экспериментами между испытуемыми, а вторые — экспериментами внутри испытуемых.


Межсубъектные эксперименты

В эксперименте между субъектами, каждый участник тестируется только в одном условии. Например, исследователь с выборкой из 100 студентов колледжа может поручить половине из них написать о травмирующем событии, а другой половине написать о нейтральном событии. Или исследователь с выборкой из 60 человек с тяжелой агорафобией (боязнью открытых пространств) может назначить 20 из них пройти каждый из трех различных видов лечения этого расстройства. В эксперименте между субъектами важно, чтобы исследователь распределял участников по таким условиям, чтобы разные группы в среднем были очень похожи друг на друга. Те, кто находится в состоянии травмы и в нейтральном состоянии, например, должны включать одинаковую пропорцию мужчин и женщин, и они должны иметь одинаковые средние коэффициенты интеллекта (IQ), одинаковые средние уровни мотивации, одинаковое среднее количество проблем со здоровьем и т. на.


Случайное назначение

Основной способ, с помощью которого исследователи выполняют такой контроль внешних переменных в разных условиях, называется случайным назначением , что означает использование случайного процесса для определения того, какие участники тестируются в каких условиях. Не путайте случайное назначение со случайной выборкой. Случайная выборка — это метод отбора выборки из совокупности, который редко используется в психологических исследованиях. Случайное распределение — это метод распределения участников выборки по различным условиям, а также важный элемент всех экспериментальных исследований в психологии и других областях.


Строго говоря, случайное назначение должно соответствовать двум критериям. Во-первых, каждый участник имеет равные шансы быть назначенным для каждого условия (например, 50% шанс быть назначенным для каждого из двух условий). Во-вторых, каждому участнику назначается условие независимо от других участников. Таким образом, один из способов распределить участников по двум условиям — подбросить монету для каждого из них. Если монета выпадает орлом, участнику назначается условие A, а если выпадает решка, участнику назначается условие B. Для трех условий можно использовать компьютер для генерации случайного целого числа от 1 до 3 для каждого участника. Если целое число равно 1, участнику присваивается условие A; если он равен 2, участнику присваивается состояние B; а если оно равно 3, участнику присваивается состояние C. На практике полная последовательность условий — по одной для каждого участника, который, как ожидается, будет участвовать в эксперименте — обычно создается заранее, и каждому новому участнику назначается следующее условие в последовательности по мере его или ее тестирования. Когда процедура компьютеризирована, компьютерная программа часто выполняет случайное назначение.


Одна из проблем с подбрасыванием монет и другими строгими процедурами случайного распределения заключается в том, что они могут привести к неравным размерам выборки в различных условиях. Неравные размеры выборки, как правило, не являются серьезной проблемой, и вы никогда не должны выбрасывать уже собранные данные, чтобы получить одинаковые размеры выборки. Однако для фиксированного числа участников статистически наиболее эффективно разделить их на группы равного размера. Поэтому стандартной практикой является использование своего рода модифицированного случайного распределения, при котором количество участников в каждой группе остается как можно более одинаковым. Один из подходов — блочная рандомизация.. При блочной рандомизации все условия выполняются один раз в последовательности, прежде чем какое-либо из них повторяется. Затем все они повторяются снова, прежде чем любой из них повторится снова. Внутри каждого из этих «блоков» условия возникают в случайном порядке. Опять же, последовательность условий обычно генерируется до того, как будут протестированы какие-либо участники, и каждому новому участнику назначается следующее условие в последовательности. В таблице 6.2 «Последовательность рандомизации блоков для распределения девяти участников по трем состояниям» показана такая последовательность для распределения девяти участников по трем состояниям. Веб-сайт Research Randomizer ( http://www.randomizer.org ).) будет генерировать последовательности рандомизации блоков для любого количества участников и условий. Опять же, когда процедура компьютеризирована, компьютерная программа часто обрабатывает рандомизацию блоков.


Таблица 6.2 Последовательность рандомизации блоков для распределения девяти участников по трем состояниям


Участник Условие

1 А

2 С

3 Б

4 Б

5 С

6 А

7 С

8 Б

9 А

Случайное назначение не гарантирует контроля всех посторонних переменных в условиях. Всегда возможно, что просто случайно участники одного состояния могут оказаться в среднем значительно старше, менее уставшими, более мотивированными или менее подавленными, чем участники другого состояния. Однако есть некоторые причины, по которым это не является серьезной проблемой. Во-первых, случайное назначение работает лучше, чем можно было бы ожидать, особенно для больших выборок. Другой заключается в том, что статистика логического вывода, которую исследователи используют, чтобы решить, отражает ли разница между группами разницу в популяции, принимает во внимание «ошибочность» случайного распределения. Еще одна причина заключается в том, что даже если случайное присвоение приводит к мешающей переменной и, следовательно, приводит к вводящим в заблуждение результатам, это, вероятно, будет обнаружено при повторении эксперимента. В результате случайное назначение условий — хотя и не безошибочное с точки зрения контроля посторонних переменных — всегда считается сильной стороной плана исследования.


Условия лечения и контроля

Эксперименты между субъектами часто используются, чтобы определить, работает ли лечение. В психологических исследованиях под лечением понимается любое вмешательство, направленное на изменение поведения людей к лучшему. Это включает в себя психотерапию и медикаментозное лечение психологических расстройств, а также вмешательства, направленные на улучшение обучения, содействие сохранению, уменьшение предубеждений и так далее. Чтобы определить, работает ли лечение, участников случайным образом распределяют либо в состояние лечения , при котором они получают лечение, либо в контрольное состояние ., в котором они не получают лечения. Если участники в терапевтическом состоянии в конечном итоге оказываются в лучшем положении, чем участники в контрольном состоянии, например, они менее подавлены, быстрее учатся, больше сохраняют, выражают меньше предубеждений, то исследователь может сделать вывод, что лечение работает. В исследованиях эффективности психотерапии и медикаментозного лечения такой тип эксперимента часто называют рандомизированным клиническим испытанием .


Существуют различные типы условий контроля. В контрольном состоянии без лечения участники вообще не получают никакого лечения. Одна проблема с этим подходом, однако, заключается в существовании эффектов плацебо. Плацебо — это симулированное лечение, в котором отсутствуют какие-либо активные ингредиенты или элементы, делающие его эффективным, и эффект плацебо .Положительный эффект от такого лечения. Многие народные средства, которые, кажется, работают, например, употребление куриного супа при простуде или помещение мыла под простыни, чтобы остановить ночные судороги в ногах, вероятно, не более чем плацебо. Хотя эффекты плацебо недостаточно изучены, они, вероятно, обусловлены в первую очередь ожиданиями людей, что они улучшатся. Ожидание улучшения может привести к снижению стресса, беспокойства и депрессии, что может изменить восприятие и даже улучшить работу иммунной системы (Price, Finniss, & Benedetti, 2008). Прайс, Д. Д., Финнисс, Д. Г., и Бенедетти, Ф. (2008). Всесторонний обзор эффекта плацебо: последние достижения и современные мысли. Ежегодный обзор психологии, 59 , 565–590.


Эффекты плацебо интересны сами по себе (см. примечание 6.28 «Мощное плацебо» ), но они также представляют серьезную проблему для исследователей, которые хотят определить, работает ли лечение. На рис. 6.2 «Гипотетические результаты исследования, включающего лечение, отсутствие лечения и состояние плацебо» показаны некоторые гипотетические результаты, в которых участники в условиях лечения в среднем улучшались больше, чем участники в контрольном состоянии без лечения. Если эти условия (две крайние левые полосы на рис. 6.2 «Гипотетические результаты исследования, включающего лечение, отсутствие лечения и плацебо»)) были единственными условиями в этом эксперименте, однако нельзя было сделать вывод, что лечение сработало. Вместо этого могло быть, что участники в группе лечения улучшились больше, потому что они ожидали улучшения, в то время как участники в контрольной группе без лечения этого не сделали.


Рисунок 6.2 . Гипотетические результаты исследования, включающего лечение, отсутствие лечения и плацебо.



К счастью, есть несколько решений этой проблемы. Один из них заключается в том, чтобы включить условие контроля плацебо ., в котором участники получают плацебо, которое очень похоже на лечение, но в нем отсутствует активный ингредиент или элемент, который, как считается, отвечает за эффективность лечения. Например, когда участники в состоянии лечения принимают таблетку, тогда участники в состоянии плацебо-контроля будут принимать идентичную таблетку, в которой отсутствует активный ингредиент в лечении («сахарная таблетка»). В исследованиях эффективности психотерапии плацебо может включать посещение психотерапевта и неструктурированный разговор о своих проблемах. Идея состоит в том, что если участники как лечебной, так и плацебо-контрольной групп ожидают улучшения, то любое улучшение в лечебной группе сверх того, что было в контрольной группе плацебо, должно быть вызвано лечением, а не ожиданиями участников.Рисунок 6.2 «Гипотетические результаты исследования, включающего лечение, отсутствие лечения и плацебо» .


Конечно, принцип информированного согласия требует, чтобы участникам сообщали, что им будет назначено либо лечение, либо плацебо-контрольное состояние, даже если они не могут быть сообщены до окончания эксперимента. Во многих случаях участникам, которые находились в контрольном состоянии, затем предлагалась возможность пройти настоящее лечение. Альтернативный подход заключается в использовании условия управления списком ожидания., в котором участникам говорят, что они получат лечение, но должны подождать, пока участники в состоянии лечения уже не получат его. Это позволяет исследователям сравнивать участников, получивших лечение, с участниками, которые в настоящее время не получают его, но все еще ожидают улучшения (в конечном итоге). Окончательное решение проблемы эффектов плацебо состоит в том, чтобы полностью исключить контрольное состояние и сравнить любое новое лечение с лучшим доступным альтернативным лечением. Например, новое лечение простой фобии можно сравнить со стандартной экспозиционной терапией. Поскольку участники с обоими состояниями получают лечение, их ожидания относительно улучшения должны быть схожими. Этот подход имеет смысл еще и потому, что если есть эффективное лечение, Интересный вопрос о новом лечении заключается не просто в том, «Работает ли оно?» но «Работает ли это лучше, чем то, что уже доступно?»


Мощное плацебо

Многих не удивляет, что плацебо может оказывать положительное влияние на расстройства, которые кажутся в основе своей психологическими, включая депрессию, тревогу и бессонницу. Однако плацебо также может оказывать положительное влияние на расстройства, которые большинство людей считают физиологическими. К ним относятся астма, язвы и бородавки (Shapiro & Shapiro, 1999). Шапиро, А.К., и Шапиро, Э. (1999). Мощное плацебо: от древнего жреца до современного врача . Балтимор, Мэриленд: Издательство Университета Джона Хопкинса. Есть даже свидетельства того, что плацебо-хирургия, также называемая «фиктивной хирургией», может быть столь же эффективной, как и реальная хирургия.


Медицинский исследователь Дж. Брюс Мозли и его коллеги провели исследование эффективности двух процедур артроскопической хирургии при остеоартрозе коленного сустава (Moseley et al., 2002). Мозли, Дж. Б., О'Мэлли, К., Петерсен, Н. Дж., Менке, Т. Дж., Броуди, Б. А., Куикендалл, Д. Х.,… Рэй, Н. П. (2002). Контролируемое исследование артроскопической хирургии остеоартрита коленного сустава. Медицинский журнал Новой Англии, 347 , 81–88.Контрольные участники этого исследования были подготовлены к операции, получили транквилизатор и даже получили три небольших разреза на коленях. Но они не получили настоящую артроскопическую хирургическую процедуру. Удивительным результатом стало то, что у всех участников улучшились как боли в колене, так и его функция, причем в группе симуляционной хирургии улучшение было таким же, как и в группах лечения. По словам исследователей, «это исследование предоставляет убедительные доказательства того, что артроскопический лаваж с хирургической обработкой или без нее [используемые хирургические процедуры] не лучше и, по-видимому, эквивалентен процедуре плацебо в уменьшении боли в колене и, по самооценке, функции» (стр. 85).


Внутрисубъектные эксперименты

Во внутрисубъектном эксперименте каждый участник тестируется во всех условиях. Рассмотрим эксперимент по влиянию физической привлекательности подсудимого на суждения о его виновности. Опять же, в эксперименте между субъектами одной группе участников показывали привлекательного ответчика и просили оценить его вину, а другой группе участников показывали непривлекательного ответчика и просили судить о его виновности. Однако во внутрисубъектном эксперименте одна и та же группа участников будет судить о виновности как привлекательного , так и непривлекательного подсудимого.


Основное преимущество этого подхода заключается в том, что он обеспечивает максимальный контроль над посторонними переменными участников. Участники во всех условиях имеют одинаковый средний IQ, одинаковый социально-экономический статус, одинаковое количество братьев и сестер и т. д., потому что это одни и те же люди. Внутрисубъектные эксперименты также позволяют использовать статистические процедуры, которые устраняют влияние этих посторонних переменных участников на зависимую переменную и, следовательно, делают данные менее «зашумленными», а влияние независимой переменной легче обнаружить. Мы рассмотрим эту идею более подробно позже в книге.


Эффекты переноса и уравновешивание

Основным недостатком внутрисубъектных планов является то, что они могут привести к эффектам переноса. Эффект переноса — это влияние тестирования в одном состоянии на поведение участников в более поздних условиях. Одним из типов эффекта переноса является эффект практики , когда участники лучше выполняют задачу в более поздних условиях, потому что у них была возможность попрактиковаться. Другой тип — это эффект усталости , когда участники хуже выполняют задачу в более поздних условиях, потому что они устают или скучают. Тестирование в одном состоянии также может изменить то, как участники воспринимают стимулы или интерпретируют свою задачу в более поздних условиях. Это называется контекстным эффектом .. Например, ответчик с обычной внешностью может быть осуждён более сурово, если участники только что оценили привлекательного ответчика, чем когда они только что осудили непривлекательного ответчика. Эксперименты с участием испытуемых также облегчают участникам угадывание гипотезы. Например, участник, которого просят судить о виновности привлекательного ответчика, а затем просят судить о виновности непривлекательного ответчика, вероятно, догадается, что гипотеза состоит в том, что привлекательность ответчика влияет на суждения о виновности. Это может привести к тому, что участник более строго осудит непривлекательного ответчика, потому что он думает, что именно этого от него и ожидают. Или это может заставить участников судить двух подсудимых одинаково, чтобы быть «справедливыми».


Эффекты переноса могут быть интересны сами по себе. (Зависит ли привлекательность одного человека от привлекательности других людей, которых мы недавно видели?) Но когда они не находятся в центре внимания исследования, эффекты переноса могут быть проблематичными. Представьте, например, что участники оценивают вину привлекательного ответчика, а затем осуждают виновного непривлекательного ответчика. Если они судят непривлекательного подсудимого более строго, это может быть связано с его непривлекательностью. Но вместо этого они могут судить его более строго, потому что им становится скучно или они устают. Другими словами, порядок условий является смешанной переменной. Привлекательное состояние всегда является первым условием, а непривлекательное состояние — вторым.


Однако существует решение проблемы эффектов порядка, которое можно использовать во многих ситуациях. Это уравновешивает, что означает тестирование разных участников в разных порядках. Например, некоторые участники будут тестироваться в состоянии привлекательного ответчика, за которым следует состояние непривлекательного ответчика, а другие будут тестироваться в непривлекательном состоянии, за которым следует привлекательное состояние. С тремя условиями будет шесть разных порядков (ABC, ACB, BAC, BCA, CAB и CBA), поэтому некоторые участники будут протестированы в каждом из шести порядков. При уравновешивании участники распределяются по заказам случайным образом с использованием методов, которые мы уже обсуждали. Таким образом, случайное распределение играет важную роль как в планах внутри субъектов, так и в планах между субъектами. Здесь вместо случайного назначения условий они случайным образом назначаются разным порядкам условий. Фактически,


Есть два способа думать о том, что достигается уравновешиванием. Во-первых, он управляет порядком условий, так что он больше не является смешанной переменной. Вместо того, чтобы привлекательное состояние всегда было первым, а непривлекательное состояние всегда вторым, привлекательное состояние стоит первым для одних участников и вторым для других. Точно так же непривлекательное состояние стоит первым для одних участников и вторым для других. Таким образом, любое общее различие в зависимой переменной между двумя условиями не может быть вызвано порядком условий. Второй способ думать о том, чего достигает уравновешивание, состоит в том, что если есть эффекты переноса, то это позволяет обнаружить их. Можно проанализировать данные отдельно по каждому заказу, чтобы увидеть, повлиял ли он.


Когда 9 больше, чем 221

Исследователь Майкл Бирнбаум утверждал, что отсутствие контекста, обеспечиваемое планами между субъектами, часто является более серьезной проблемой, чем эффекты контекста, создаваемые планами внутри субъектов. Чтобы продемонстрировать это, он попросил одну группу участников оценить, насколько большим было число 9 по оценочной шкале от 1 до 10, а другую группу оценить, насколько большим было число 221 по той же оценочной шкале от 1 до 10 (Бирнбаум). , 1999). Бирнбаум, М.Х. (1999). Как показать, что 9 > 221: Соберите суждения в межсубъектном плане. Психологические методы, 4 , 243–249.Участники этого межсубъектного исследования дали цифре 9 среднюю оценку 5,13, ​​а цифре 221 — среднюю оценку 3,10. Другими словами, они оценили 9 больше, чем 221! По словам Бирнбаума, это происходит потому, что участники спонтанно сравнивали 9 с другими однозначными числами (в этом случае оно относительно велико) и 221 с другими трехзначными числами (в этом случае оно относительно мало).


Одновременные внутрисубъектные планы

До сих пор мы обсуждали подход к внутрисубъектным планам, в котором участники тестируются в одном состоянии за раз. Однако есть и другой подход, который часто используется, когда участники дают несколько ответов в каждом условии. Представьте, например, что участники судят о виновности 10 привлекательных подсудимых и 10 непривлекательных подсудимых. Вместо того чтобы заставлять людей выносить суждения обо всех 10 подсудимых одного типа, за которыми следуют все 10 подсудимых другого типа, исследователь может представить всех 20 подсудимых в последовательности, в которой смешаны два типа. Затем исследователь мог вычислить средний рейтинг каждого участника для каждого типа ответчика. Или представьте себе эксперимент, целью которого было выяснить, помнят ли люди с социальным тревожным расстройством отрицательные прилагательные (например, «глупый», «некомпетентный») лучше, чем положительные (например, «счастливый, «производительный»). Исследователь может предложить участникам изучить один список, включающий оба типа слов, а затем предложить им вспомнить как можно больше слов. Затем исследователь мог подсчитать количество припоминаемых слов каждого типа. Есть много способов определить порядок, в котором предъявляются стимулы, но один из распространенных способов — создать различный случайный порядок для каждого участника.


Между субъектами или внутри субъектов?

Почти каждый эксперимент может быть проведен с использованием как плана между субъектами, так и плана внутри субъектов. Это означает, что исследователи должны выбирать между двумя подходами, исходя из их относительных достоинств в конкретной ситуации.


Преимущество экспериментов между субъектами состоит в том, что они концептуально проще и требуют меньше времени на тестирование каждого участника. Они также избегают эффектов переноса без необходимости уравновешивания. Преимущество внутригрупповых экспериментов состоит в том, что они контролируют посторонние переменные участников, что обычно уменьшает шум в данных и облегчает обнаружение взаимосвязи между независимыми и зависимыми переменными.


Хорошее эмпирическое правило заключается в том, что если есть возможность провести эксперимент внутри испытуемых (с надлежащим уравновешиванием) за время, отведенное на одного участника, и у вас нет серьезных опасений по поводу эффектов переноса, то это, вероятно, лучший вариант. вариант. Если внутрисубъектный план сложно или невозможно выполнить, вам следует вместо этого рассмотреть межсубъектный план. Например, если вы тестировали участников в приемной врача или покупателей в очереди в продуктовом магазине, у вас может не хватить времени для тестирования каждого участника во всех условиях, и поэтому вы выберете межсубъектный план. Или представьте, что вы пытаетесь снизить уровень предрассудков людей, заставляя их общаться с представителями другой расы. План внутри субъектов с уравновешиванием потребует тестирования некоторых участников сначала в условиях лечения, а затем в контрольных условиях. Но если лечение сработает и снизит уровень предрассудков у людей, то они больше не будут пригодны для тестирования в контрольном состоянии. Это верно для многих дизайнов, включающих лечение, направленное на долгосрочное изменение поведения участников (например, исследования, проверяющие эффективность психотерапии). Ясно, что здесь необходим межсубъектный план. исследования, проверяющие эффективность психотерапии). Ясно, что здесь необходим межсубъектный план. исследования, проверяющие эффективность психотерапии). Ясно, что здесь необходим межсубъектный план.


Помните также, что использование одного типа дизайна не исключает использования другого типа в другом исследовании. Нет никаких причин, по которым исследователь не мог бы использовать как план между субъектами, так и план внутри субъектов, чтобы ответить на один и тот же исследовательский вопрос. На самом деле профессиональные исследователи часто именно так и поступают.


КЛЮЧЕВЫЕ ВЫВОДЫ

Эксперименты могут проводиться с использованием планов между субъектами или внутри субъектов. Принятие решения о том, что использовать в конкретной ситуации, требует тщательного рассмотрения плюсов и минусов каждого подхода.

Случайное назначение условий в экспериментах между субъектами или порядков условий в экспериментах внутри субъектов является фундаментальным элементом экспериментального исследования. Его цель состоит в том, чтобы контролировать посторонние переменные, чтобы они не становились смешивающими переменными.

Экспериментальное исследование эффективности лечения требует как условия лечения, так и контрольного состояния, которое может быть контрольным состоянием без лечения, контрольным состоянием плацебо или контрольным состоянием списка ожидания. Экспериментальные методы лечения также можно сравнить с наилучшей доступной альтернативой.

УПРАЖНЕНИЯ

Обсуждение: по каждой из следующих тем перечислите плюсы и минусы межсубъектного и внутрисубъектного дизайна и решите, какой из них лучше.


Вы хотите проверить относительную эффективность двух программ подготовки к марафонскому бегу.

Используя фотографии людей в качестве стимулов, вы хотите увидеть, воспринимаются ли улыбающиеся люди как более умные, чем люди, которые не улыбаются.

В полевом эксперименте вы хотите увидеть, влияет ли то, как одет нищий (опрятно или неряшливо), дают ли ему деньги прохожие.

Вы хотите проверить, запоминаются ли конкретные существительные (например, собака ) лучше, чем абстрактные существительные (например, правда ).

Обсуждение: представьте, что эксперимент показывает, что участники, получающие психодинамическую терапию по поводу фобии собак, выздоравливают больше, чем участники контрольной группы, не получавшей лечения. Объясните фундаментальную проблему, связанную с этим планом исследования, и по крайней мере два способа ее исправления.

6.3 Проведение экспериментов

ЦЕЛИ ОБУЧЕНИЯ

Опишите несколько стратегий набора участников для эксперимента.

Объясните, почему важно стандартизировать процедуру эксперимента и несколько способов сделать это.

Объясните, что такое пилотное тестирование и почему оно важно.

Информации, представленной до сих пор в этой главе, достаточно, чтобы спланировать простой эксперимент. Однако когда приходит время проводить этот эксперимент, возникает несколько дополнительных практических вопросов. В этом разделе мы рассмотрим некоторые из этих проблем и пути их решения. Большая часть этой информации применима как к неэкспериментальным исследованиям, так и к экспериментальным.


Набор участников

Конечно, вы должны думать о том, как привлечь участников с самого начала любого исследовательского проекта. Например, если у вас нет доступа к людям, страдающим шизофренией, или к несовершеннолетним правонарушителям, находящимся в заключении, нет смысла планировать исследование, посвященное этим группам населения. Но даже если вы планируете использовать удобную выборку, вам придется набирать участников для своего исследования.


Существует несколько подходов к набору участников. Один из них заключается в использовании участников из формального пула субъектов .— сложившаяся группа людей, давших согласие на то, чтобы с ними связались по поводу участия в научных исследованиях. Например, во многих колледжах и университетах есть предметный пул, состоящий из студентов, зачисленных на вводные курсы по психологии, которые должны принять участие в определенном количестве исследований, чтобы соответствовать требованиям курса. Исследователи публикуют описания своих исследований, а студенты регистрируются для участия, как правило, через онлайн-систему. Участники, не входящие в тематические пулы, также могут быть привлечены путем размещения или публикации рекламных объявлений или личных обращений к группам, представляющим интересующую группу населения. Например, исследователь, заинтересованный в изучении пожилых людей, может организовать выступление на собрании жителей пенсионного сообщества, чтобы объяснить исследование и попросить добровольцев.


Волонтерская тема

Даже если участники исследования получают компенсацию в виде курсового кредита, небольшой суммы денег или шанса на лечение от психологической проблемы, они все равно остаются добровольцами. Это стоит учитывать, потому что люди, добровольно участвующие в психологических исследованиях, предсказуемо отличаются от тех, кто не участвует в них. В частности, есть убедительные доказательства того, что в среднем добровольцы обладают следующими характеристиками по сравнению с недобровольцами (Rosenthal & Rosnow, 1976): Rosenthal, R. & Rosnow, RL (1976). Волонтерская тема . Нью-Йорк, штат Нью-Йорк: Уайли.


Их больше интересует тема исследования.

Они более образованны.

У них больше потребность в одобрении.

У них более высокий коэффициент интеллекта (IQ).

Они более общительны.

Они выше по социальному классу.

Это может быть проблемой внешней валидности, если есть основания полагать, что участники с такими характеристиками, вероятно, будут вести себя иначе, чем население в целом. Например, при тестировании различных методов убеждения людей рациональный аргумент может работать лучше на добровольцев, чем на население в целом, из-за их в целом более высокого уровня образования и IQ.


Во многих полевых экспериментах задача состоит не в наборе участников, а в их выборе. Например, исследователи Николя Геген и Мари-Аньес де Гейл провели полевой эксперимент по изучению влияния улыбки на помощь, в котором участниками были покупатели в супермаркете. Сообщник, спускающийся по лестнице, смотрел прямо на покупателя, идущего по лестнице, и либо улыбался, либо не улыбался. Вскоре после этого покупатель столкнулся с другим сообщником, который уронил на землю несколько компьютерных дискет. Зависимой переменной было то, остановился ли покупатель, чтобы помочь подобрать дискеты (Guéguen & de Gail, 2003). Геген, Н., и де Гейл, Мари-Аньес. (2003). Влияние улыбки на помогающее поведение: улыбка и доброе самарянинское поведение. Отчеты о связи, 16 , 133–140.Обратите внимание, что эти участники не были «набраны», но исследователям все же нужно было выбрать их среди всех покупателей, поднимавшихся по лестнице в тот день. Чрезвычайно важно, чтобы этот вид отбора производился в соответствии с четко определенным набором правил, которые устанавливаются до начала сбора данных и могут быть четко объяснены впоследствии. В этом случае при каждом спуске по лестнице сообщнику давали указание смотреть на первого встречного человека в возрасте от 20 до 50 лет. Только если человек смотрел в ответ, он или она становился участником исследование. Смысл наличия четко определенного правила отбора состоит в том, чтобы избежать предвзятости при выборе участников. Например, если бы сообщник был свободен выбирать, на каких покупателей он будет смотреть, он мог выбрать дружелюбно выглядящих покупателей, когда он настроен улыбаться, и недружелюбно выглядящих, когда он не настроен улыбаться. Как мы вскоре увидим, такие предубеждения могут быть совершенно непреднамеренными.


Стандартизация процедуры

Во время процедуры на удивление легко ввести посторонние переменные. Например, один и тот же экспериментатор может давать четкие инструкции одному участнику, но расплывчатые инструкции другому. Или один экспериментатор может тепло приветствовать участников, в то время как другой едва смотрит им в глаза. В той мере, в какой такие переменные влияют на поведение участников, они добавляют шум к данным и затрудняют обнаружение влияния независимой переменной. Если они различаются в зависимости от условий, они становятся смешивающими переменными и дают альтернативные объяснения результатов. Например, если участников экспериментальной группы тестирует теплый и дружелюбный экспериментатор, а участников контрольной группы — холодный и недружелюбный,


Пол экспериментатора как посторонняя переменная

Хорошо известно, что на результаты исследования может повлиять то, являются ли участники исследования мужчинами или женщинами. Но как насчет того, является ли экспериментатор мужчиной или женщиной? Существует множество доказательств того, что это тоже имеет значение. Мужчины и женщины-экспериментаторы несколько по-разному взаимодействуют со своими участниками, и, конечно же, участники по-разному реагируют на мужчин и женщин-экспериментаторов (Rosenthal, 1976). Розенталь, Р. (1976). Эффекты экспериментатора в поведенческих исследованиях (расширенная ред.). Нью-Йорк, штат Нью-Йорк: Уайли. Например, в недавнем исследовании восприятия боли участники погружали руки в ледяную воду так долго, как только могли (Ibolya, Brake, & Voss, 2004).Иболя, К., Брейк, А., и Восс, У. (2004). Влияние характеристик экспериментатора на отчеты о боли у женщин и мужчин. Боль, 112 , 142–147. Участники мужского пола дольше терпели боль, когда экспериментатором была женщина, а участники женского пола дольше терпели боль, когда экспериментатором был мужчина.


Исследователь Роберт Розенталь провел большую часть своей карьеры, показывая, что такого рода непреднамеренные изменения в процедуре действительно влияют на поведение участников. Кроме того, одним из важных источников таких вариаций являются ожидания экспериментатора относительно того, как участники «должны» вести себя в эксперименте. Это называется эффектом ожидания экспериментатора (Rosenthal, 1976). Розенталь, Р. (1976). Эффекты экспериментатора в поведенческих исследованиях (расширенная ред.). Нью-Йорк, штат Нью-Йорк: Уайли.Например, если экспериментатор ожидает, что участники лечебной группы справятся с заданием лучше, чем участники контрольной группы, то он или она может непреднамеренно дать участникам лечебной группы более четкие инструкции или больше поощрения или дать им больше времени для выполнения задания. . Поразительный пример: Розенталь и Кермит Фоде попросили нескольких студентов лабораторного курса психологии обучать крыс бегать по лабиринту. Хотя крысы были генетически похожи, некоторым студентам сказали, что они работают с крысами, способными ходить в лабиринте, которые были выведены, чтобы быть хорошими учениками, а другим студентам сказали, что они работают с крысами, которые не умеют ходить в лабиринте. были воспитаны, чтобы быть плохими учениками. Конечно же, за пять дней обучения «лабиринтные» крысы давали больше правильных ответов, быстрее давали правильные ответы.Розенталь Р. и Фоде К. (1963). Влияние предвзятости экспериментатора на поведение крысы-альбиноса. Наука о поведении, 8 , 183-189. Ясно, что это должны были быть ожидания студентов относительно того, как крысы поведут себя, что имело значение. Но как? Некоторые подсказки получены из данных, собранных в конце исследования, которые показали, что студенты, которые ожидали, что их крысы будут учиться быстро, чувствовали себя более позитивно по отношению к своим животным и сообщали, что вели себя по отношению к ним более дружелюбно (например, больше обращались с ними).


Способ свести к минимуму непреднамеренные изменения в процедуре — максимально стандартизировать ее, чтобы она выполнялась одинаково для всех участников, независимо от их состояния. Вот несколько способов сделать это:


Создайте письменный протокол, в котором будет указано все, что экспериментаторы должны делать и говорить, с момента, когда они приветствуют участников, до момента, когда они их отпускают.

Составьте стандартные инструкции, которые участники читают сами или слово в слово читает им экспериментатор.

Остальную часть процедуры максимально автоматизируйте, используя для этой цели пакеты программ или даже простые компьютерные слайд-шоу.

Предугадывайте вопросы участников и либо задавайте их и отвечайте на них в инструкциях, либо разрабатывайте для них стандартные ответы.

Обучите несколько экспериментаторов протоколу вместе и попросите их попрактиковаться друг на друге.

Убедитесь, что каждый экспериментатор тестирует участников во всех условиях.

Другой хорошей практикой является обеспечение того, чтобы экспериментаторы были «слепы» к исследовательскому вопросу или к условиям, в которых тестируется каждый участник. Идея состоит в том, чтобы свести к минимуму эффекты ожидания экспериментатора путем минимизации ожиданий экспериментаторов. Например, в исследовании лекарств, в котором каждый участник получает лекарство или плацебо, часто бывает так, что ни участники, ни экспериментатор, взаимодействующий с участниками, не знают, какое состояние ему или ей было назначено. Поскольку и участники, и экспериментаторы не замечают этого состояния, это называется двойным слепым исследованием.исследование. (Простое слепое исследование — это исследование, в котором участник, но не экспериментатор, не видит условия.) Конечно, во многих случаях это невозможно. Например, если вы одновременно являетесь исследователем и единственным экспериментатором, вы не можете оставаться слепым к вопросу исследования. Кроме того, во многих исследованиях экспериментатор должен знать условие, потому что он или она должны выполнять процедуру по-разному в разных условиях.


Бухучет, ведение учета, делопроизводство

Очень важно вести хорошие записи, когда вы проводите эксперимент. Как обсуждалось ранее, экспериментаторы обычно создают письменную последовательность условий до начала исследования, а затем проверяют каждого нового участника в следующем условии в последовательности. Когда вы их тестируете, рекомендуется добавить в этот список базовую демографическую информацию; дата, время и место проведения испытаний; и имя экспериментатора, проводившего тестирование. Также неплохо иметь место, где экспериментатор мог бы записывать комментарии о необычных случаях (например, о замешательстве или отказе участника) или возникающих вопросах. Такая информация может пригодиться позже, если вы решите проанализировать половые различия или влияние разных экспериментаторов, или если возникнет вопрос о конкретном участнике или сеансе тестирования.


Также может быть полезно присвоить идентификационный номер каждому участнику, когда вы их тестируете. Обычно достаточно просто пронумеровать их последовательно, начиная с 1. Затем этот номер можно также записать на любых листах ответов или анкетах, созданных участниками, что упрощает их хранение.


Пилотное тестирование

Всегда полезно провести пробную проверку вашего эксперимента. Пилотный тест — это небольшое исследование, проводимое для того, чтобы убедиться, что новая процедура работает, как планировалось. В пилотном тесте вы можете набирать участников формально (например, из установленного пула участников) или неофициально из числа членов семьи, друзей, одноклассников и т. д. Количество участников может быть небольшим, но этого должно быть достаточно, чтобы вы были уверены, что ваша процедура работает по плану. Есть несколько важных вопросов, на которые вы можете ответить, проведя пилотный тест:


Понимают ли участники инструкции?

Какие недоразумения возникают у участников, какие ошибки они совершают и какие вопросы задают?

Участники скучают или разочаровываются?

Эффективна ли косвенная манипуляция? (Вам нужно будет включить проверку манипуляции.)

Могут ли участники угадать исследовательский вопрос или гипотезу?

Сколько времени занимает процедура?

Правильно ли работают компьютерные программы или другие автоматизированные процедуры?

Правильно ли записываются данные?

Конечно, чтобы ответить на некоторые из этих вопросов, вам нужно будет внимательно наблюдать за участниками во время процедуры и поговорить с ними об этом позже. Участники часто не решаются критиковать исследование в присутствии исследователя, поэтому убедитесь, что они понимают, что это экспериментальный тест, и вы искренне заинтересованы в отзывах, которые помогут вам улучшить процедуру. Если процедура работает по плану, то можно приступать к фактическому исследованию. Если есть проблемы, которые нужно решить, вы можете решить их, протестировать новую процедуру и продолжать этот процесс, пока не будете готовы к нему.


КЛЮЧЕВЫЕ ВЫВОДЫ

Есть несколько эффективных методов, которые вы можете использовать для набора участников исследования для вашего эксперимента, в том числе через формальные пулы испытуемых, рекламу и личные обращения. Полевые эксперименты требуют четко определенных процедур отбора участников.

Важно стандартизировать экспериментальные процедуры, чтобы свести к минимуму посторонние переменные, включая эффекты ожидания экспериментатора.

Важно провести одно или несколько небольших пилотных испытаний эксперимента, чтобы убедиться, что процедура работает по плану.

УПРАЖНЕНИЯ

Практика: перечислите два способа, которыми вы можете набирать участников из каждой из следующих групп населения: (а) пожилые люди, (б) безработные, (в) регулярно занимающиеся спортом и (г) математические специальности.

Обсуждение: представьте себе исследование, в котором вы визуально представляете участникам список из 20 слов по одному, ждете некоторое время, а затем просите их вспомнить как можно больше слов. В состоянии стресса им говорят, что они также могут быть выбраны для выступления с короткой речью перед небольшой аудиторией. В нестрессовом состоянии им не говорят, что им, возможно, придется произнести речь. Какие конкретные вещи вы могли бы сделать, чтобы стандартизировать процедуру?







https://saylordotorg.github.io/text_research-methods-in-psychology/s11-nonexperimental-research.html



Неэкспериментальные исследования

Что общего у следующих классических исследований?


Стэнли Милгрэм обнаружил, что около двух третей участников его исследования были готовы подвергнуть другого человека опасным ударам тока только потому, что им приказал авторитетный человек (Milgram, 1963). Милгрэм, С. (1963). Поведенческое исследование послушания. Журнал ненормальной и социальной психологии, 67 , 371–378.

Элизабет Лофтус и Жаклин Пикрелл показали, что относительно легко «внушить» людям ложные воспоминания, неоднократно спрашивая их о событиях детства, которые на самом деле с ними не происходили (Loftus & Pickrell, 1995). Лофтус, Э. Ф., и Пикрелл, Дж. Э. (1995). Формирование ложных воспоминаний. Психиатрические анналы, 25 , 720–725.

Джон Качиоппо и Ричард Петти оценили достоверность своей Шкалы потребности в познании — показателя степени, в которой люди любят и ценят мышление, — сравнив баллы профессоров колледжей с баллами фабричных рабочих (Cacioppo & Petty, 1982). Качиоппо, Дж. Т., и Петти, Р. Е. (1982). Потребность в познании. Журнал личности и социальной психологии, 42 , 116–131.

Дэвид Розенхан обнаружил, что сообщники, которые обращались в психиатрические больницы, утверждая, что слышали голоса, произносящие такие вещи, как «пустой» и «глухой звук», были отмечены персоналом больницы как шизофреники и содержались там, хотя во всех других отношениях они вели себя нормально (Rosenhan, 1973). . Розенхан, Д.Л. (1973). О том, чтобы быть в здравом уме в безумных местах. Наука, 179 , 250–258.

Ответ для целей этой главы состоит в том, что они не являются экспериментами. В этой главе мы более подробно рассмотрим неэкспериментальные исследования. Мы начнем с общего определения неэкспериментального исследования, а также с обсуждения того, когда и почему неэкспериментальное исследование более уместно, чем экспериментальное. Затем мы отдельно рассмотрим три важных типа неэкспериментальных исследований: корреляционное исследование, квазиэкспериментальное исследование и качественное исследование.


7.1 Обзор неэкспериментальных исследований

ЦЕЛИ ОБУЧЕНИЯ

Дайте определение неэкспериментальному исследованию, четко отделите его от экспериментального исследования и приведите несколько примеров.

Объясните, когда исследователь может предпочесть проведение неэкспериментального исследования экспериментальному.

Что такое неэкспериментальное исследование?

Неэкспериментальное исследование — это исследование, в котором отсутствует манипулирование независимой переменной, случайное назначение участников условиям или порядкам условий, или и тому, и другому.


В некотором смысле несправедливо определять этот большой и разнообразный набор подходов в совокупности тем, чем они не являются . Но это отражает тот факт, что большинство исследователей в области психологии считают различие между экспериментальным и неэкспериментальным исследованием чрезвычайно важным. Это связано с тем, что, хотя экспериментальные исследования могут предоставить убедительные доказательства того, что изменения в независимой переменной вызывают различия в зависимой переменной, неэкспериментальные исследования, как правило, этого не могут. Однако, как мы увидим, это не означает, что неэкспериментальное исследование менее важно, чем экспериментальное исследование, или уступает ему в каком-либо общем смысле.


Когда использовать неэкспериментальное исследование

Как мы видели в главе 6 «Экспериментальное исследование» , экспериментальное исследование уместно, когда у исследователя есть конкретный исследовательский вопрос или гипотеза о причинно-следственной связи между двумя переменными — и возможно, осуществимо и этично манипулировать независимой переменной и случайным образом назначать участников к условиям или к порядкам условий. Поэтому само собой разумеется, что неэкспериментальные исследования уместны и даже необходимы, когда эти условия не выполняются. Есть много способов, которыми это может быть.


Вопрос исследования или гипотеза могут касаться одной переменной, а не статистической связи между двумя переменными (например, насколько точны первые впечатления людей?).

Вопрос исследования может касаться некаузальной статистической связи между переменными (например, существует ли корреляция между вербальным интеллектом и математическим интеллектом?).

Вопрос исследования может касаться причинно-следственной связи, но независимая переменная не может быть изменена или участники не могут быть случайным образом распределены по условиям или порядкам условий (например, влияет ли повреждение гиппокампа человека на формирование следов долговременной памяти?).

Вопрос исследования может быть широким и исследовательским, или он может касаться того, каково это иметь определенный опыт (например, каково быть работающей матерью с диагнозом депрессия?).

Опять же, выбор между экспериментальным и неэкспериментальным подходами обычно диктуется характером исследовательского вопроса. Если речь идет о причинно-следственной связи и включает в себя независимую переменную, которой можно манипулировать, экспериментальный подход обычно предпочтительнее. В противном случае предпочтение отдается неэкспериментальному подходу. Но эти два подхода можно также использовать для решения одного и того же исследовательского вопроса взаимодополняющими способами. Например, неэкспериментальные исследования, устанавливающие связь между просмотром телевизора с насилием и агрессивным поведением, были дополнены экспериментальными исследованиями, подтверждающими причинно-следственную связь (Bushman & Huesmann, 2001). Бушман, Б.Дж., и Хьюсманн, Л.Р. (2001). Влияние телевизионного насилия на агрессию. В Д. Сингер и Дж. Сингер (ред.),Справочник детей и СМИ (стр. 223–254). Тысяча дубов, Калифорния: Sage. Точно так же после своего первоначального исследования Милгрэм провел эксперименты, чтобы изучить факторы, влияющие на послушание. Он манипулировал несколькими независимыми переменными, такими как расстояние между экспериментатором и участником, участником и сообщником, а также место проведения исследования (Milgram, 1974). Милгрэм, С. (1974). Повиновение авторитету: экспериментальный взгляд . Нью-Йорк, штат Нью-Йорк: Harper & Row.


Типы неэкспериментальных исследований

Неэкспериментальные исследования делятся на три широкие категории: исследования с одной переменной, корреляционные и квазиэкспериментальные исследования и качественные исследования. Во-первых, исследование может быть неэкспериментальным, поскольку оно фокусируется на одной переменной, а не на статистической взаимосвязи между двумя переменными. Хотя широко распространенного термина для такого рода исследований не существует, мы будем называть его исследованием с одной переменной .. Первоначальное исследование послушания Милгрэма не было экспериментальным в этом отношении. В первую очередь его интересовала одна переменная — степень, в которой участники подчинялись исследователю, когда он велел им ударить током сообщника, — и он наблюдал, как все участники выполняли одно и то же задание в одинаковых условиях. Исследование Лофтуса и Пикрелла, описанное в начале этой главы, также является хорошим примером исследования с одной переменной. Переменная заключалась в том, «вспоминали ли» участники пережитые в детстве легкие травмирующие события (например, потеря в торговом центре), которых они на самом деле не испытали, но о которых их неоднократно спрашивали в ходе исследования. В этом конкретном исследовании почти треть участников «вспомнили» хотя бы одно событие. (Как и в случае с оригинальным исследованием Милгрэма,


Как видно из этих примеров, исследования с одной переменной могут дать ответы на интересные и важные вопросы. Однако он не может ответить на вопросы о статистических взаимосвязях между переменными. Это момент, который начинающие исследователи иногда упускают. Представьте себе, например, группу исследовательских методов студентов, интересующихся взаимосвязью между детьми, ставшими жертвами буллинга, и детской самооценкой. Первое, что, вероятно, придет в голову этим исследователям, — это получить выборку учащихся средней школы, над которыми издевались, а затем измерить их самооценку. Но это было бы исследование с одной переменной и самооценкой в ​​качестве единственной переменной. Хотя это могло бы рассказать исследователям кое-что о самооценке детей, над которыми издевались, но не то, что они действительно хотят знать.сравнима с самооценкой детей, у которых нет. Это ниже? Это то же самое? Может быть даже выше? Чтобы ответить на этот вопрос, их выборка также должна включать учащихся средней школы, которые не подвергались издевательствам.


Исследование также может быть неэкспериментальным, поскольку оно сосредоточено на статистической взаимосвязи между двумя переменными, но не включает манипулирование независимой переменной, случайное назначение участников условиям или порядкам условий, или и тому, и другому. Этот вид исследования принимает две основные формы: корреляционное исследование и квазиэкспериментальное исследование. В корреляционном исследовании исследователь измеряет две интересующие переменные, практически не пытаясь контролировать посторонние переменные, а затем оценивает взаимосвязь между ними. Учащийся, изучающий метод исследования, который выясняет, подвергался ли травле каждый из нескольких учеников средней школы, а затем измеряет самооценку каждого ученика, проводит корреляционное исследование. В квазиэкспериментальных исследованиях, исследователь манипулирует независимой переменной, но не распределяет участников случайным образом по условиям или порядкам условий. Например, исследователь может запустить программу борьбы с травлей (своего рода лечение) в одной школе и сравнить частоту издевательств в этой школе с частотой в аналогичной школе, в которой нет программы борьбы с травлей.


Последний способ, которым исследование может быть неэкспериментальным, — это то, что оно может быть качественным. Все типы исследований, которые мы обсуждали до сих пор, являются количественными, имея в виду тот факт, что данные состоят из чисел, которые анализируются с использованием статистических методов. В качественных исследованиях, данные обычно нечисловые и анализируются с использованием нестатистических методов. Исследование Розенханом переживаний людей, находящихся в психиатрическом отделении, было прежде всего качественным. Данные представляли собой записи, сделанные «псевдопациентами» — людьми, которые притворялись, будто слышат голоса, — вместе с их больничными картами. Анализ Розенхана состоит в основном из письменного описания переживаний псевдопациентов, подкрепленного несколькими конкретными примерами. Чтобы проиллюстрировать склонность персонала больницы «обезличивать» своих пациентов, он отметил: «После госпитализации я и другие псевдопациенты проходили первоначальный медицинский осмотр в полуобщественной комнате, где сотрудники занимались своими делами, как будто нас там не было». (Розенхан, 1973, стр. 256). Розенхан, Д.Л. (1973). О том, чтобы быть в здравом уме в безумных местах.Наука, 179 , 250–258.


Пересмотр внутренней валидности

Напомним, что внутренняя валидность — это степень, в которой дизайн исследования поддерживает вывод о том, что изменения в независимой переменной вызвали любые наблюдаемые различия в зависимой переменной. Рисунок 7.1показывает, как экспериментальные, квазиэкспериментальные и корреляционные исследования различаются по внутренней достоверности. Экспериментальные исследования имеют тенденцию быть самыми высокими, потому что они решают проблемы направленности и третьей переменной посредством манипулирования и контроля посторонних переменных посредством случайного назначения. Если средний балл зависимой переменной в эксперименте различается в зависимости от условий, вполне вероятно, что независимая переменная ответственна за это различие. Корреляционное исследование является самым низким, потому что оно не решает ни одну из проблем. Если средний балл зависимой переменной различается по уровням независимой переменной, это можетбыть, что независимая переменная ответственна, но есть и другие интерпретации. В некоторых ситуациях направление причинно-следственной связи может быть обратным. В других может быть третья переменная, которая вызывает различия как в независимых, так и в зависимых переменных. Квазиэкспериментальное исследование находится посередине, потому что манипулирование независимой переменной решает некоторые проблемы, но отсутствие случайного распределения и экспериментального контроля не решает других. Представьте, например, что исследователь находит две похожие школы, запускает программу борьбы с травлей в одной из них, а затем обнаруживает меньше случаев травли в этой «лечебной школе», чем в «контрольной школе». Здесь нет проблемы направленности, потому что очевидно, что количество случаев издевательств не определяло, какая школа получила программу. Однако,


Рисунок 7.1



Эксперименты, как правило, обладают высокой внутренней достоверностью, квазиэксперименты — ниже, а корреляционные исследования — еще ниже.


Обратите также внимание на рис. 7.1 , что существует некоторое совпадение внутренней валидности экспериментов, квазиэкспериментов и корреляционных исследований. Например, плохо спланированный эксперимент, включающий множество смешанных переменных, может иметь более низкую внутреннюю валидность, чем хорошо спланированный квазиэксперимент без очевидных смешанных переменных.


КЛЮЧЕВЫЕ ВЫВОДЫ

Неэкспериментальное исследование — это исследование, в котором отсутствует манипулирование независимой переменной, контроль посторонних переменных посредством случайного назначения или и то, и другое.

Существует три основных типа неэкспериментальных исследований. Исследования с одной переменной фокусируются на одной переменной, а не на отношениях между переменными. Корреляционные и квазиэкспериментальные исследования сосредоточены на статистической взаимосвязи, но в них отсутствует манипуляция или случайное назначение. Качественные исследования сосредоточены на более широких вопросах исследования, обычно включают сбор больших объемов данных от небольшого числа участников и нестатистический анализ данных.

В целом, экспериментальные исследования обладают высокой внутренней валидностью, корреляционные исследования имеют низкую внутреннюю валидность, а квазиэкспериментальные исследования занимают промежуточное положение.

УПРАЖНЕНИЕ

Обсуждение: Для каждого из следующих исследований решите, к какому типу относится исследование, и объясните, почему.


Исследователь проводит подробные интервью с неженатыми отцами-подростками, чтобы узнать, что они чувствуют и что думают о своей роли отцов, и резюмирует их чувства в письменном повествовании.

Исследователь измеряет импульсивность большой выборки водителей и изучает статистическую связь между этой переменной и количеством штрафов за нарушение правил дорожного движения, которые получили водители.

Исследователь случайным образом распределяет пациентов с болью в пояснице либо на лечение, включающее гипноз, либо на лечение, включающее физические упражнения. Затем она измеряет их уровень боли в пояснице через 3 месяца.

Преподаватель колледжа проводит еженедельные викторины для студентов в одном разделе своего курса, но не проводит еженедельных викторин для студентов в другом разделе, чтобы увидеть, повлияет ли это на их успеваемость.

7.2 Корреляционные исследования

ЦЕЛИ ОБУЧЕНИЯ

Дайте определение корреляционным исследованиям и приведите несколько примеров.

Объясните, почему исследователь может выбрать проведение корреляционного исследования, а не экспериментального исследования или другого типа неэкспериментального исследования.

Что такое корреляционное исследование?

Корреляционное исследование — это тип неэкспериментального исследования, в котором исследователь измеряет две переменные и оценивает статистическую взаимосвязь (т. е. корреляцию) между ними, практически не прилагая усилий для контроля посторонних переменных. По сути, есть две причины, по которым исследователи, интересующиеся статистическими отношениями между переменными, предпочитают проводить корреляционное исследование, а не эксперимент. Во-первых, они не верят, что статистическая связь является причинно-следственной. Например, исследователь может оценить достоверность краткого теста на экстраверсию, проведя его для большой группы участников вместе с более длительным тестом на экстраверсию, валидность которого уже доказана. Затем этот исследователь может проверить, сильно ли коррелируют баллы участников по краткому тесту с их баллами по более длинному тесту. Считается, что ни один из результатов теста не является причиной другого, поэтому независимой переменной, которой можно было бы манипулировать, нет. На самом деле условиянезависимая переменная и зависимая переменная не применяются к этому виду исследований.


Другая причина, по которой исследователи предпочитают использовать корреляционное исследование, а не эксперимент, заключается в том, что интересующая статистическая связь считается причинно-следственной, но исследователь не может манипулировать независимой переменной, потому что это невозможно, непрактично или неэтично. Например, Аллен Каннер и его коллеги считали, что количество «ежедневных неприятностей» (например, грубые продавцы, интенсивное движение), с которыми сталкиваются люди, влияет на количество физических и психологических симптомов, которые они испытывают (Kanner, Coyne, Schaefer, & Lazarus, 1981). ). Каннер, А. Д., Койн, Дж. К., Шефер, К., и Лазарус, Р. С. (1981). Сравнение двух режимов измерения стресса: ежедневные неприятности и подъемы по сравнению с крупными жизненными событиями. Журнал поведенческой медицины, 4 , 1–39.Но поскольку они не могли манипулировать количеством ежедневных неприятностей, с которыми сталкивались их участники, им пришлось довольствоваться измерением количества ежедневных неприятностей — наряду с количеством симптомов — с помощью анкет самоотчетов. Хотя сильная положительная взаимосвязь, которую они обнаружили между этими двумя переменными, согласуется с их идеей о том, что неприятности вызывают симптомы, она также согласуется с идеей о том, что симптомы вызывают неприятности или что какая-то третья переменная (например, невротизм) вызывает и то, и другое.


Распространенное заблуждение среди начинающих исследователей заключается в том, что корреляционное исследование должно включать две количественные переменные, такие как баллы по двум тестам на экстраверсию или количество неприятностей и количество симптомов, с которыми столкнулись люди. Однако определяющей чертой корреляционного исследования является то, что измеряются две переменные — ни одна из них не подвергается манипуляциям — и это верно независимо от того, являются ли переменные количественными или категориальными. Представьте, например, что исследователь применяет шкалу самооценки Розенберга к 50 американским студентам колледжей и 50 японским студентам колледжей. Хотя это «ощущается» как эксперимент между испытуемыми, это корреляционное исследование, поскольку исследователь не манипулировал национальностью студентов. То же самое относится и к исследованию Качиоппо и Петти, сравнивающих преподавателей колледжей и фабричных рабочих с точки зрения их потребности в познании. Это корреляционное исследование, потому что исследователи не манипулировали профессиями участников.


Рисунок 7.2 «Результаты гипотетического исследования того, испытывают ли люди, которые ежедневно составляют списки дел, меньше стресса, чем люди, которые не составляют таких списков»показывает данные гипотетического исследования взаимосвязи между тем, составляют ли люди ежедневный список дел («список дел») и стрессом. Обратите внимание, что неясно, является ли это экспериментом или корреляционным исследованием, потому что неясно, манипулировали ли независимой переменной. Если исследователь случайным образом поручил некоторым участникам составлять ежедневные списки дел, а другим — нет, то это эксперимент. Если исследователь просто спрашивал участников, составляли ли они ежедневные списки дел, то это корреляционное исследование. Различие важно, потому что если бы исследование было экспериментом, то можно было бы сделать вывод, что составление ежедневных списков дел снижает стресс участников. Но если бы это было корреляционное исследование, можно было бы сделать вывод только о том, что эти переменные статистически связаны. Возможно, стресс отрицательно влияет на способность людей планировать заранее (проблема направленности). Или, возможно, более добросовестные люди чаще составляют списки дел и меньше подвержены стрессу (проблема третьей переменной). Важным моментом является то, что то, что определяет исследование как экспериментальное или корреляционное, определяется не изучаемыми переменными, не тем, являются ли переменные количественными или категориальными, не типом графика или статистики, используемой для анализа данных. это ни о том, являются ли переменные количественными или категориальными, ни о типе графика или статистики, используемых для анализа данных. это ни о том, являются ли переменные количественными или категориальными, ни о типе графика или статистики, используемых для анализа данных. этокак проводится исследование.


Рисунок 7.2 . Результаты гипотетического исследования того, испытывают ли люди, которые ежедневно составляют списки дел, меньше стресса, чем люди, которые не составляют таких списков



Сбор данных в корреляционных исследованиях

Опять же, определяющей чертой корреляционного исследования является то, что ни одна из переменных не подвергается манипуляциям. Неважно, как и где измеряются переменные. Исследователь мог бы предложить участникам прийти в лабораторию для выполнения компьютеризированной задачи на диапазон цифр в обратном порядке и компьютеризированной задачи по принятию решений с риском, а затем оценить взаимосвязь между оценками участников по этим двум задачам. Или исследователь может пойти в торговый центр, чтобы спросить людей об их отношении к окружающей среде и покупательских привычках, а затем оценить взаимосвязь между этими двумя переменными. Оба этих исследования были бы корреляционными, потому что никакие независимые переменные не манипулируются. Однако, поскольку некоторые подходы к сбору данных тесно связаны с корреляционными исследованиями, имеет смысл обсудить их здесь. Два из них, на которых мы сосредоточимся, — это натуралистические наблюдения и архивные данные. Третье исследование, обзорное исследование, обсуждается в отдельной главе.


Натуралистическое наблюдение

Натуралистическое наблюдениеэто подход к сбору данных, который включает в себя наблюдение за поведением людей в среде, в которой оно обычно происходит. Таким образом, натуралистическое наблюдение является типом полевого исследования (в отличие от лабораторного исследования). Это может быть наблюдение за покупателями в продуктовом магазине, за детьми на школьной площадке или за психиатрическими больными в их палатах. Исследователи, занимающиеся натуралистическим наблюдением, обычно делают свои наблюдения как можно ненавязчивее, чтобы участники часто не осознавали, что их изучают. С этической точки зрения это считается приемлемым, если участники остаются анонимными, а поведение происходит в публичной обстановке, где люди обычно не ожидают конфиденциальности. Покупатели продуктовых магазинов, кладущие товары в свои тележки, например, вовлечены в публичное поведение, которое легко заметить сотрудникам магазина и другим покупателям. По этой причине большинство исследователей считают этически приемлемым наблюдение за ними для исследования. С другой стороны, один из аргументов против этичности натуралистического наблюдения за «поведением в ванной», обсуждавшегося ранее в книге, заключается в том, что у людей есть разумное ожидание уединения даже в общественном туалете, и что это ожидание было нарушено.


Исследователи Роберт Левин и Ара Норензаян использовали натуралистические наблюдения для изучения различий в «темпе жизни» в разных странах (Левин и Норензаян, 1999). Левин, Р.В., и Норензаян, А. (1999). Темп жизни в 31 стране. Журнал межкультурной психологии, 30 , 178–205. Одна из их мер заключалась в наблюдении за пешеходами в большом городе, чтобы узнать, сколько времени им потребовалось, чтобы пройти 60 футов. Они обнаружили, что люди в некоторых странах ходят достоверно быстрее, чем люди в других странах. Например, люди в США и Японии преодолели 60 футов в среднем примерно за 12 секунд, а жители Бразилии и Румынии — около 17 секунд.


Поскольку натуралистическое наблюдение происходит в сложном и даже хаотичном «реальном мире», есть две тесно связанные проблемы, с которыми исследователи должны разобраться, прежде чем собирать данные. Первый – это выборка. Когда, где и при каких условиях будут производиться наблюдения и за кем именно? Левин и Норензаян описали свой процесс отбора проб следующим образом:


Скорость ходьбы мужчин и женщин на расстоянии 60 футов измерялась как минимум в двух местах в основных центральных районах каждого города. Измерения проводились в основные рабочие часы в ясные летние дни. Все места были плоскими, свободными, имели широкие тротуары и были достаточно малолюдными, чтобы пешеходы могли двигаться с потенциально максимальной скоростью. Чтобы контролировать эффекты общения, использовались только пешеходы, идущие в одиночку. Дети, лица с явными физическими недостатками и витрины не учитывались. В большинстве городов было замерено 35 мужчин и 35 женщин. (стр. 186)


Таким образом, точное описание процесса выборки делает сбор данных управляемым для наблюдателей, а также обеспечивает некоторый контроль над важными посторонними переменными. Например, проводя наблюдения в ясные летние дни во всех странах, Левин и Норензаян контролировали влияние погоды на скорость ходьбы людей.


Второй вопрос – измерение. Какое конкретное поведение будет наблюдаться? В исследовании Левина и Норензаяна измерение было относительно простым. Они просто измерили 60-футовое расстояние вдоль городского тротуара, а затем использовали секундомер для измерения времени участников, когда они проходили это расстояние. Однако часто поведение, представляющее интерес, не столь очевидно и объективно. Например, исследователи Роберт Краут и Роберт Джонстон хотели изучить реакцию боулеров на их удары, как когда они смотрели на кегли, так и когда они поворачивались к своим товарищам (Kraut & Johnston, 1979). Краут, Р.Э., и Джонстон, Р.Э. (1979). Социальные и эмоциональные сообщения улыбки: этологический подход. Журнал личности и социальной психологии, 37 , 1539–1553.Но какие «реакции» они должны наблюдать? Основываясь на предыдущих исследованиях и собственном пилотном тестировании, Краут и Джонстон составили список реакций, в который вошли «закрытая улыбка», «открытая улыбка», «смех», «нейтральное лицо», «посмотреть вниз», «отвести взгляд» и «покрытие лица» (закрытие лица руками). Наблюдатели запоминали этот список, а затем практиковались, кодируя реакции боулеров, которые были записаны на видео. Во время самого исследования наблюдатели говорили в диктофон, описывая наблюдаемые реакции. Одним из наиболее интересных результатов этого исследования было то, что боулеры редко улыбались, когда они все еще смотрели на кегли. Они с гораздо большей вероятностью улыбались после того, как повернулись к своим спутникам, что позволяет предположить, что улыбка — это не просто выражение счастья, но и форма социального общения.


Когда наблюдения требуют суждения со стороны наблюдателей — как в исследовании Краута и Джонстона — этот процесс часто называют кодированием .. Кодирование обычно требует четкого определения набора целевых действий. Затем наблюдатели классифицируют участников по отдельности с точки зрения того, какое поведение они проявляли, и сколько раз они участвовали в каждом поведении. Наблюдатели могут даже записывать продолжительность каждого поведения. Целевое поведение должно быть определено таким образом, чтобы разные наблюдатели кодировали его одинаково. Это вопрос межтерминальной надежности. Ожидается, что исследователи продемонстрируют межэкспертную надежность своей процедуры кодирования, заставив несколько оценщиков независимо кодировать одно и то же поведение, а затем показав, что разные наблюдатели находятся в близком согласии. Краут и Джонстон, например, записали на видео подмножество реакций своих участников, и два наблюдателя независимо закодировали их.


Архивные данные

Другой подход к корреляционным исследованиям — это использование архивных данных , то есть данных, которые уже были собраны для какой-то другой цели. Примером может служить исследование Бретта Пелхэма и его коллег о «скрытом эгоизме» — склонности людей отдавать предпочтение людям, местам и вещам, которые похожи на них самих (Pelham, Carvallo, & Jones, 2005). Пелхэм, Б.В., Карвалло, М., и Джонс, Дж.Т. (2005). Скрытый эгоизм. Текущие направления в психологической науке, 14 , 106–110. В одном исследовании они изучили записи социального обеспечения, чтобы показать, что женщины с именами Вирджиния, Джорджия, Луиза и Флоренс чаще всего переезжали в штаты Вирджиния, Джорджия, Луизиана и Флорида соответственно.


Как и в случае натуралистического наблюдения, измерение может быть более или менее простым при работе с архивными данными. Например, относительно просто подсчитать количество людей с фамилией Вирджиния, проживающих в разных штатах, на основе данных социального обеспечения. Но рассмотрим исследование взаимосвязи между оптимизмом и здоровьем, проведенное Кристофером Петерсоном и его коллегами с использованием данных, собранных много лет назад для исследования развития взрослых (Peterson, Seligman, & Vaillant, 1988). Петерсон, К., Селигман, член Европарламента, и Вайлант, Г.Э. (1988). Пессимистический стиль объяснения является фактором риска соматического заболевания: 35-летнее лонгитюдное исследование. Журнал личности и социальной психологии, 55 , 23–27.В 1940-х годах здоровые студенты мужского пола заполнили открытый вопросник о трудном опыте военного времени. В конце 1980-х Петерсон и его коллеги проанализировали ответы мужчин на анкеты, чтобы получить представление о стиле объяснения — их привычных способах объяснения плохих событий, которые с ними происходят. Более пессимистичные люди склонны винить себя и ожидать долгосрочных негативных последствий, затрагивающих многие аспекты их жизни, в то время как более оптимистичные люди склонны обвинять внешние силы и ожидать ограниченных негативных последствий. Чтобы получить меру объяснительного стиля для каждого участника, исследователи использовали процедуру, в которой все негативные события, упомянутые в ответах на вопросы анкеты, и любые их причинно-следственные объяснения были идентифицированы и записаны на каталожных карточках. Они были переданы отдельной группе оценщиков, которые оценили каждое объяснение с точки зрения трех отдельных аспектов оптимизма-пессимизма. Затем эти оценки усреднялись для получения оценки стиля объяснения для каждого участника. Затем исследователи оценили статистическую взаимосвязь между стилем объяснений мужчин, когда они были студентами колледжа, и архивными показателями их здоровья примерно в 60-летнем возрасте. Основной результат заключался в том, что чем более оптимистичными были мужчины в студенческие годы, тем здоровее они были в пожилом возрасте. Пирсона Затем исследователи оценили статистическую взаимосвязь между стилем объяснений мужчин, когда они были студентами колледжа, и архивными показателями их здоровья примерно в 60-летнем возрасте. Основной результат заключался в том, что чем более оптимистичными были мужчины в студенческие годы, тем здоровее они были в пожилом возрасте. Пирсона Затем исследователи оценили статистическую взаимосвязь между стилем объяснений мужчин, когда они были студентами колледжа, и архивными показателями их здоровья примерно в 60-летнем возрасте. Основной результат заключался в том, что чем более оптимистичными были мужчины в студенческие годы, тем здоровее они были в пожилом возрасте. Пирсонаr был +0,25.


Это пример контент-анализа — семейства систематических подходов к измерению с использованием сложных архивных данных. Точно так же, как натуралистическое наблюдение требует определения интересующего поведения, а затем отмечая его по мере его появления, анализ контента требует указания ключевых слов, фраз или идей, а затем нахождения всех их вхождений в данных. Затем эти случаи можно подсчитать, замерить по времени (например, количество времени, посвященное развлекательным темам в вечерних новостях) или проанализировать множеством других способов.


КЛЮЧЕВЫЕ ВЫВОДЫ

Корреляционное исследование включает измерение двух переменных и оценку взаимосвязи между ними без манипулирования независимой переменной.

Корреляционное исследование не определяется тем, где и как собираются данные. Однако некоторые подходы к сбору данных тесно связаны с корреляционными исследованиями. К ним относятся натуралистическое наблюдение (при котором исследователи наблюдают за поведением людей в контексте, в котором оно обычно происходит) и использование архивных данных, которые уже были собраны для какой-либо другой цели.

УПРАЖНЕНИЕ

Обсуждение: по каждому из следующих вопросов решите, является ли описанное исследование наиболее вероятным экспериментальным или корреляционным, и объясните, почему.


Исследователь в области образования сравнивает успеваемость учащихся из «богатой» части города с успеваемостью учащихся из «бедной» части города.

Когнитивный психолог сравнивает способность людей вспоминать слова, которые им было приказано «прочитать», с их способностью вспоминать слова, которые им было приказано «вообразить».

Менеджер изучает корреляцию между средними баллами новых сотрудников в колледже и их отчетами об успеваемости за первый год.

Автомобильный инженер устанавливает различные рычаги переключения передач в новый прототип автомобиля, каждый раз прося нескольких человек оценить, насколько комфортно они себя чувствуют.

Ученый-диетолог изучает взаимосвязь между температурой в холодильниках людей и количеством бактерий в их продуктах питания.

Социальный психолог говорит некоторым участникам исследования, что им нужно поторопиться в соседнее здание, чтобы закончить исследование. Она говорит другим, что они могут не торопиться. Затем она наблюдает, останавливаются ли они, чтобы помочь научному сотруднику, который притворяется обиженным.

7.3 Квазиэкспериментальное исследование

ЦЕЛИ ОБУЧЕНИЯ

Объясните, что такое квазиэкспериментальное исследование, и четко разграничьте его как с экспериментальными, так и с корреляционными исследованиями.

Опишите три разных типа квазиэкспериментальных планов исследования (неэквивалентные группы, претест-посттест и прерванный временной ряд) и приведите примеры каждого из них.

Приставка « квази » означает «похожий». Таким образом, квазиэкспериментальное исследование — это исследование, которое напоминает экспериментальное исследование, но не является настоящим экспериментальным исследованием. Хотя независимой переменной манипулируют, участники не распределяются случайным образом по условиям или порядкам условий (Cook & Campbell, 1979). Кук, Т.Д., и Кэмпбелл, Д.Т. (1979). Квазиэксперимент: вопросы проектирования и анализа в полевых условиях . Бостон, Массачусетс: Хоутон Миффлин.Поскольку с независимой переменной манипулируют до того, как будет измерена зависимая переменная, квазиэкспериментальное исследование устраняет проблему направленности. Но поскольку участники распределяются не случайным образом, что делает вероятным наличие других различий между условиями, квазиэкспериментальное исследование не устраняет проблему смешения переменных. Таким образом, с точки зрения внутренней достоверности квазиэксперименты обычно находятся где-то между корреляционными исследованиями и настоящими экспериментами.


Квази-эксперименты, скорее всего, будут проводиться в полевых условиях, когда случайное назначение затруднено или невозможно. Их часто проводят для оценки эффективности лечения — возможно, психотерапии или образовательного вмешательства. Существует множество различных видов квазиэкспериментов, но здесь мы обсудим лишь некоторые из наиболее распространенных.


Дизайн неэквивалентных групп

Вспомним, что когда участников эксперимента между испытуемыми случайным образом распределяют по условиям, получающиеся в результате группы, скорее всего, будут очень похожими. По сути, исследователи считают их эквивалентными. Однако, когда участники не случайным образом распределяются по условиям, полученные группы, вероятно, будут в чем-то различаться. По этой причине исследователи считают их неэквивалентными. Таким образом , неэквивалентный групповой план представляет собой межсубъектный план, в котором участники не были случайным образом распределены по условиям.


Представьте себе, например, исследователя, который хочет оценить новый метод обучения дробей третьеклассников. Одним из способов может быть проведение исследования с экспериментальной группой, состоящей из одного класса учащихся третьего класса, и контрольной группой, состоящей из другого класса учащихся третьего класса. Это будет неэквивалентный дизайн групп, потому что исследователь не распределяет студентов по классам случайным образом, а это означает, что между ними могут быть важные различия. Например, родители более успевающих или более мотивированных учеников могли с большей вероятностью просить, чтобы их детей определили в класс мисс Уильямс. Или директор мог назначить «нарушителей спокойствия» в класс мистера Джонса, потому что он более строгий приверженец дисциплины. Конечно, стили учителей и даже классная обстановка, могут быть очень разными и могут вызывать разные уровни достижений или мотивации среди учащихся. Если в конце исследования существовала разница в знаниях двух классов о дробях, это могло быть вызвано различием в методах обучения, а могло быть вызвано любой из этих смешанных переменных.


Конечно, исследователи, использующие дизайн неэквивалентных групп, могут предпринять шаги, чтобы их группы были как можно более похожими. В данном примере исследователь мог бы попытаться выбрать два класса в одной и той же школе, где учащиеся двух классов имеют одинаковые баллы на стандартном тесте по математике, а учителя одного пола, одного возраста и имеют одинаковое преподавание. стили. Принятие таких мер повысит внутреннюю валидность исследования, поскольку устранит некоторые из наиболее важных смешанных переменных. Но без действительно случайного распределения студентов по условиям остается возможность других важных смешанных переменных, которые исследователь не мог контролировать.


Претестовый и посттестовый дизайн

В дизайне претест-посттест, зависимая переменная измеряется один раз до реализации обработки и один раз после ее реализации. Представьте себе, например, исследователя, который интересуется эффективностью антинаркотической образовательной программы по отношению учащихся начальной школы к запрещенным наркотикам. Исследователь мог измерить отношение учащихся в конкретной начальной школе в течение одной недели, реализовать программу по борьбе с наркотиками в течение следующей недели и, наконец, снова измерить их отношение на следующей неделе. Схема «претест-посттест» очень похожа на эксперимент с участием испытуемых, в котором каждый участник тестируется сначала в контрольных условиях, а затем в условиях лечения. Однако это не похоже на эксперимент с участием испытуемых.


Если средний балл после теста лучше, чем средний балл до теста, то имеет смысл сделать вывод, что лечение может быть причиной улучшения. К сожалению, часто нельзя заключить это с высокой степенью уверенности, потому что могут быть другие объяснения того, почему результаты посттеста лучше. Одна категория альтернативных объяснений называется историей . Между претестом и посттестом могли произойти другие вещи. Возможно, по телевидению транслировалась антинаркотическая программа, и многие студенты ее смотрели, или, возможно, знаменитость умерла от передозировки наркотиков, и многие студенты слышали об этом. Другая категория альтернативных объяснений называется созреванием .. Участники могли измениться между претестом и посттестом так, как они и так собирались, потому что они растут и учатся. Если бы это была годовая программа, участники могли бы стать менее импульсивными или лучше рассуждать, и это могло бы быть причиной изменений.


Другим альтернативным объяснением изменения зависимой переменной в плане до и после тестирования является регрессия к среднему значению . Это относится к статистическому факту, что человек, получивший экстремально высокие баллы по переменной в одном случае, будет склонен набирать менее экстремальные баллы в следующий раз. Например, боулер с долгосрочным средним значением 150, который внезапно выбивает 220, почти наверняка наберет меньше очков в следующей игре. Ее оценка будет «регрессировать» к ее среднему баллу 150. Регрессия к среднему может быть проблемой, когда участников отбирают для дальнейшего исследования, потому чтоих предельных значений. Представьте, например, что только учащимся, набравшим особенно низкие баллы по тесту дробей, дается специальная программа обучения, а затем проводится повторное тестирование. Регрессия к среднему почти гарантирует, что их баллы будут выше, даже если программа обучения не даст никакого эффекта. Тесно связанное понятие — и чрезвычайно важное в психологических исследованиях — это спонтанная ремиссия .. Это тенденция многих медицинских и психологических проблем со временем улучшаться без какого-либо лечения. Обычная простуда является хорошим примером. Если бы сегодня измеряли тяжесть симптомов у 100 больных простудой, давали бы им тарелку куриного супа каждый день, а затем снова измеряли бы тяжесть их симптомов через неделю, их состояние, вероятно, значительно улучшилось бы. Однако это не означает, что куриный бульон был причиной улучшения, потому что они могли бы значительно улучшиться без какого-либо лечения. То же самое относится и ко многим психологическим проблемам. Группа людей с тяжелой депрессией сегодня, вероятно, будет менее подавлена ​​в среднем через 6 месяцев. Анализируя результаты нескольких исследований лечения депрессии,Постернак, М.А., и Миллер, И. (2001). Кратковременное течение большой депрессии без лечения: метаанализ исследований с использованием результатов исследований с использованием контрольных групп списка ожидания. Журнал аффективных расстройств, 66 , 139–146. Таким образом, в целом нужно быть очень осторожным в выводе причинно-следственной связи из планов до и после тестирования.


Работает ли психотерапия?

Ранние исследования эффективности психотерапии, как правило, использовали схемы «претест-посттест». В классической статье 1952 года исследователь Ганс Айзенк обобщил результаты 24 таких исследований, показав, что примерно у двух третей пациентов улучшилось состояние между претестом и посттестом (Eysenck, 1952). Айзенк, Х. Дж. (1952). Эффекты психотерапии: оценка. Журнал консультационной психологии, 16 , 319–324. Но Айзенк также сравнил эти результаты с архивными данными из государственных больниц и отчетов страховых компаний, показывающих, что аналогичные пациенты выздоравливают примерно с той же скоростью без лечения.получение психотерапии. Это навело Айзенка на мысль, что улучшение, которое пациенты показывали в исследованиях до и после тестирования, могло быть не более чем спонтанной ремиссией. Обратите внимание, что Айзенк не делал вывод о неэффективности психотерапии. Он просто пришел к выводу, что доказательств тому нет, и написал о «необходимости должным образом спланированных и проведенных экспериментальных исследований в этой важной области» (стр. 323). Вы можете прочитать всю статью здесь:


http://psychclassics.yorku.ca/Eysenck/psychotherapy.htm


К счастью, многие другие исследователи приняли вызов Айзенка, и к 1980 году были проведены сотни экспериментов, в которых участников случайным образом распределяли по лечебным и контрольным условиям, а результаты были обобщены в классической книге Мэри Ли Смит, Джин Гласс и Томаса. Миллер (Смит, Гласс и Миллер, 1980). Смит, М.Л., Гласс, Г.В., и Миллер, Т.И. (1980). Преимущества психотерапии . Балтимор, Мэриленд: Издательство Университета Джона Хопкинса. Они обнаружили, что в целом психотерапия была довольно эффективной: около 80% участников лечения улучшились больше, чем средний участник контрольной группы. Последующие исследования были больше сосредоточены на условиях, при которых различные виды психотерапии более или менее эффективны.


Дизайн прерванных временных рядов

Разновидностью схемы претест-посттест является схема прерывистых временных рядов . Временной ряд представляет собой набор измерений, выполненных с интервалами в течение определенного периода времени. Например, производственная компания может еженедельно измерять производительность своих рабочих в течение года. В дизайне прерывистых временных рядов такой временной ряд «прерывается» обработкой. В одном классическом примере лечение заключалось в сокращении рабочих смен на фабрике с 10 до 8 часов (Cook & Campbell, 1979). Кук, Т.Д., и Кэмпбелл, Д.Т. (1979). Квазиэксперимент: вопросы проектирования и анализа в полевых условиях . Бостон, Массачусетс: Хоутон Миффлин.Поскольку после сокращения рабочих смен производительность возросла довольно быстро и оставалась высокой в ​​течение многих месяцев после этого, исследователь пришел к выводу, что сокращение рабочих смен вызвало увеличение производительности. Обратите внимание, что план прерванных временных рядов подобен плану претест-посттест, поскольку он включает измерения зависимой переменной как до, так и после лечения. Однако он отличается от схемы предварительного и последующего тестирования тем, что включает несколько измерений до и после тестирования.


На рис. 7.5 «План гипотетического прерывистого временного ряда» показаны данные исследования гипотетического прерывистого временного ряда. Зависимой переменной является количество пропусков занятий студентами в неделю на курсе по методам исследования. Лечение заключается в том, что инструктор начинает каждый день публично отмечать посещаемость, чтобы студенты знали, что инструктор знает, кто присутствует, а кто отсутствует. На верхней панели рисунка 7.5 «Гипотетический прерванный временной ряд» показано, как могли бы выглядеть данные, если бы эта обработка сработала. До лечения наблюдается стабильно высокое количество пропусков занятий, а после лечения наблюдается немедленное и устойчивое снижение пропусков занятий. Нижняя часть рисунка 7.5 «Гипотетический прерванный временной ряд»показывает, как могли бы выглядеть данные, если бы эта обработка не сработала. В среднем количество пропусков занятий после лечения примерно такое же, как и до него. Этот рисунок также иллюстрирует преимущество схемы прерывистых временных рядов по сравнению с более простой схемой предварительного и последующего тестирования. Если бы было проведено только одно измерение абсансов до лечения на 7-й неделе и одно после него на 8-й неделе, то это выглядело бы так, как будто лечение было ответственно за снижение. Многочисленные измерения как до, так и после лечения показывают, что снижение между 7 и 8 неделями является не чем иным, как нормальным изменением от недели к неделе.


Рис. 7.5 . Гипотетический прерванный план временных рядов



На верхней панели показаны данные, свидетельствующие о том, что лечение привело к сокращению пропусков занятий. Нижняя панель показывает данные, которые предполагают, что это не так.


Комбинированные конструкции

Тип квазиэкспериментального плана, который обычно лучше, чем план неэквивалентных групп или план до и после тестирования, сочетает в себе элементы обоих. Есть лечебная группа, которая проходит предварительный тест, получает лечение, а затем проходит посттест. Но в то же время есть контрольная группа, которая проходит претест, не получает лечения, а затем проходит посттест. Таким образом, вопрос заключается не просто в том, улучшаются ли результаты участников, получающих лечение, а в том, улучшаются ли они больше , чем участники, не получающие лечения.


Представьте, например, что учащиеся в одной школе проходят предварительное тестирование на предмет их отношения к наркотикам, затем участвуют в программе по борьбе с наркотиками и, наконец, проходят итоговое тестирование. Учащиеся в аналогичной школе проходят предварительный тест, не подвергаются программе по борьбе с наркотиками и, наконец, проходят посттест. Опять же, если учащиеся в состоянии лечения становятся более негативными по отношению к наркотикам, это может быть результатом лечения, но это также может быть вопросом истории или взросления. Если это действительно результат лечения, то учащиеся в состоянии лечения должны стать более негативными, чем учащиеся в контрольном состоянии. Но если это вопрос истории (например, новости о передозировке наркотиков знаменитостью) или взросления (например, улучшение рассуждений), то учащиеся в обоих состояниях, вероятно, продемонстрируют одинаковые изменения. Однако такой план не полностью исключает возможность смешения переменных. Что-то может произойти в одной из школ, но не произойти в другой (например, передозировка наркотиков учеником), поэтому это затронет учеников первой школы, а учеников другой школы — нет.


Наконец, если участникам такого плана случайным образом назначают условия, он становится настоящим экспериментом, а не квазиэкспериментом. По сути, именно к такому эксперименту призывал Айзенк — и он уже неоднократно проводился — для демонстрации эффективности психотерапии.


КЛЮЧЕВЫЕ ВЫВОДЫ

Квазиэкспериментальное исследование предполагает манипулирование независимой переменной без случайного назначения участников условиям или порядкам условий. Среди важных типов — планы неэквивалентных групп, планы до и после тестирования и планы с прерывистыми временными рядами.

Квазиэкспериментальное исследование устраняет проблему направленности, поскольку предполагает манипулирование независимой переменной. Однако это не устраняет проблему смешения переменных, поскольку не предполагает случайного присвоения условий. По этим причинам квазиэкспериментальные исследования обычно имеют более высокую внутреннюю валидность, чем корреляционные исследования, но более низкую, чем настоящие эксперименты.

УПРАЖНЕНИЯ

Практика: представьте, что два профессора колледжа решают проверить влияние ежедневных тестов на успеваемость студентов по курсу статистики. Они решают, что профессор А будет проводить викторины, а профессор Б — нет. Затем они сравнивают успеваемость учащихся по двум разделам на общем выпускном экзамене. Укажите пять других переменных, которые могут различаться между двумя разделами и влиять на результаты.

Обсуждение: представьте, что группа детей с ожирением набирается для исследования, в ходе которого измеряется их вес, затем они участвуют в течение 3 месяцев в программе, поощряющей их быть более активными, и, наконец, их вес снова измеряется. Объясните, как каждое из следующих действий может повлиять на результаты:


регрессия к среднему

спонтанная ремиссия

история

созревание

7.4 Качественные исследования

ЦЕЛИ ОБУЧЕНИЯ

Перечислите несколько отличий качественного исследования от количественного исследования в психологии.

Опишите сильные и слабые стороны качественных исследований в психологии по сравнению с количественными исследованиями.

Приведите примеры качественных исследований в психологии.

Что такое качественное исследование?

Эта книга в первую очередь посвящена количественным исследованиям.. Количественные исследователи обычно начинают с целенаправленного исследовательского вопроса или гипотезы, собирают небольшое количество данных от каждого из большого числа людей, описывают полученные данные с помощью статистических методов и делают общие выводы о некоторой большой совокупности. Хотя это, безусловно, наиболее распространенный подход к проведению эмпирических исследований в психологии, существует важная альтернатива, называемая качественным исследованием. Качественные исследования зародились в дисциплинах антропологии и социологии, но теперь они также используются для изучения многих психологических тем. Качественные исследователи обычно начинают с менее целенаправленного исследовательского вопроса, собирают большие объемы относительно «нефильтрованных» данных от относительно небольшого числа людей и описывают свои данные, используя нестатистические методы.опыт участников их исследования.


Возьмем, к примеру, исследование Пера Линдквиста и его коллег, которые хотели узнать, как семьи подростков-самоубийц справляются со своей потерей (Lindqvist, Johansson, & Karlsson, 2008). Линдквист, П., Йоханссон, Л., и Карлссон, У. (2008). После подросткового самоубийства: качественное исследование психосоциальных последствий для выживших членов семьи. BMC Psychiatry, 8 , 26. Получено с http://www.biomedcentral.com/1471-244X/8/26 . У них не было конкретного исследовательского вопроса или гипотезы, например: Какой процент членов семьи вступает в группы поддержки суицидов? Вместо этого они хотели понять разнообразие реакций, которые были у семей, с акцентом на то, на что это похоже с их стороны.перспективы. Для этого они опросили семьи 10 подростков-самоубийц в их домах в сельской местности Швеции. Интервью были относительно неструктурированными, начиная с общей просьбы к семьям рассказать о жертве и заканчивая приглашением поговорить о чем-нибудь еще, что они хотели бы рассказать интервьюеру. Одной из самых важных тем, поднятых в ходе этих интервью, было то, что, даже когда жизнь вернулась в «нормальное русло», семьи продолжали бороться с вопросом о том, почему их любимый человек покончил жизнь самоубийством. Эта борьба оказалась особенно трудной для семей, в которых самоубийство было самым неожиданным.


Цель качественного исследования

Опять же, эта книга в первую очередь посвящена количественным исследованиям в психологии. Сила количественных исследований заключается в их способности давать точные ответы на конкретные вопросы исследования и делать общие выводы о поведении человека. Вот откуда мы знаем, например, что люди склонны подчиняться авторитетным фигурам или что студентки колледжа не намного более разговорчивы, чем студенты колледжей мужского пола. Но хотя количественные исследования хороши для получения точных ответов на конкретные исследовательские вопросы, они далеко не так хороши для получения результатов.новые и интересные исследовательские вопросы. Точно так же, хотя количественные исследования хороши для получения общих выводов о человеческом поведении, они далеко не так хороши для подробного описания поведения конкретных групп в конкретных ситуациях. И вообще не очень хорошо получается передать, каково это на самом деле быть членом определенной группы в конкретной ситуации.


Но относительная слабость количественного исследования — это относительная сила качественного исследования. Качественные исследования могут помочь исследователям генерировать новые интересные исследовательские вопросы и гипотезы. Исследование Линдквиста и его коллег, например, предполагает, что может существовать общая связь между тем, насколько неожиданным является самоубийство, и тем, насколько семья поглощена попытками понять, почему подросток совершил самоубийство. Теперь эту взаимосвязь можно изучить с помощью количественных исследований. Но неясно, возник бы ли вообще этот вопрос, если бы исследователи не сели вместе с семьями и не выслушали, что они сами хотели сказать о своем опыте. Качественные исследования также могут предоставить подробные и подробные описания человеческого поведения в контексте реального мира, в котором оно происходит.Гирц, К. (1973). Интерпретация культур . Нью-Йорк, штат Нью-Йорк: Основные книги. Точно так же качественное исследование может передать ощущение того, что на самом деле значит быть членом определенной группы или в определенной ситуации — то, что качественные исследователи часто называют «жизненным опытом» участников исследования. Линдквист и его коллеги, например, описывают, как все семьи спонтанно предлагали интервьюеру показать спальню жертвы или место, где произошло самоубийство, — показывая важность этих физических мест для семей. Кажется маловероятным, чтобы количественное исследование обнаружило это.


Сбор и анализ данных в качественных исследованиях

Как и в случае с корреляционными исследованиями, подходы к сбору данных в качественных исследованиях весьма разнообразны и могут включать натуралистические наблюдения, архивные данные, произведения искусства и многое другое. Но одним из наиболее распространенных подходов, особенно для психологических исследований, является проведение интервью .. Интервью в качественных исследованиях, как правило, неструктурированы и состоят из небольшого количества общих вопросов или подсказок, которые позволяют участникам говорить о том, что их интересует. Исследователь может продолжить, задавая более подробные вопросы по темам, которые возникают. Такие интервью могут быть длительными и подробными, но обычно они проводятся с относительно небольшой выборкой. По сути, именно такой подход использовали Линдквист и его коллеги в своих исследованиях семей переживших самоубийство. Небольшие группы людей, которые вместе участвуют в интервью, посвященных определенной теме или проблеме, часто называют фокус-группами .. Взаимодействие между участниками фокус-группы иногда может дать больше информации, чем можно получить в ходе интервью один на один. Использование фокус-групп стало стандартным методом в бизнесе и промышленности среди тех, кто хочет понять вкусы и предпочтения потребителей. Содержание всех интервью с фокус-группами обычно записывается и расшифровывается, чтобы облегчить последующий анализ.


Еще одним подходом к сбору данных в качественных исследованиях является включенное наблюдение. При включенном наблюдении исследователи становятся активными участниками группы или ситуации, которую они изучают. Данные, которые они собирают, могут включать интервью (обычно неструктурированные), их собственные заметки, основанные на их наблюдениях и взаимодействиях, документы, фотографии и другие артефакты. Основное обоснование включенного наблюдения заключается в том, что может быть важная информация, которая доступна или может быть интерпретирована только кем-то, кто является активным участником группы или ситуации. Пример включенного наблюдения взят из исследования социолога Эми Уилкинс (опубликовано в журнале Social Psychology Quarterly ).) о религиозной организации колледжа, которая подчеркивала, насколько счастливы ее члены (Wilkins, 2008). Уилкинс, А. (2008). «Счастливее, чем нехристиане»: коллективные эмоции и символические границы среди евангельских христиан. Social Psychology Quarterly, 71 , 281–301. Уилкинс провела 12 месяцев, посещая собрания и общественные мероприятия группы и участвуя в них, а также взяла интервью у нескольких членов группы. В своем исследовании Уилкинс определила несколько способов, которыми группа «навязывала» счастье, например, постоянно говоря о счастье, препятствуя выражению негативных эмоций и используя счастье как способ выделиться среди других групп.


Анализ данных в количественных исследованиях

Хотя количественные и качественные исследования обычно различаются по нескольким важным аспектам (например, по специфике исследовательского вопроса, типу собранных данных), это метод анализа данных.что отличает их более четко, чем что-либо еще. Чтобы проиллюстрировать эту идею, представьте себе группу исследователей, которая проводит серию неструктурированных интервью с выздоравливающими алкоголиками, чтобы узнать о роли их религиозной веры в их выздоровлении. Хотя это звучит как качественное исследование, представьте себе далее, что после сбора данных они кодируют данные с точки зрения того, как часто каждый участник упоминает Бога (или «высшую силу»), а затем используют описательную и логическую статистику, чтобы выяснить, те, кто чаще упоминает Бога, более успешно воздерживаются от алкоголя. Теперь это звучит как количественное исследование. Другими словами, количественное и качественное различие больше зависит от того, что исследователи делают с собранными ими данными, чем от того, почему или как они собирали данные.


Но как выглядит качественный анализ данных? Так же, как существует множество способов сбора данных в качественных исследованиях, существует множество способов их анализа. Здесь мы сосредоточимся на одном общем подходе, называемом обоснованной теорией (Glaser & Strauss, 1967). Глейзер, Б.Г., и Штраус, А.Л. (1967). Открытие обоснованной теории: стратегии качественных исследований . Чикаго, Иллинойс: Альдин.Этот подход был разработан в области социологии в 1960-х годах и постепенно завоевал популярность в психологии. Помните, что в количественных исследованиях исследователь обычно начинает с теории, выводит гипотезу из этой теории, а затем собирает данные для проверки этой конкретной гипотезы. В качественном исследовании с использованием обоснованной теории исследователи начинают с данных и разрабатывают теорию или интерпретацию, которая «основана» на этих данных. Делают это поэтапно. Во-первых, они выявляют идеи, которые повторяются в данных. Затем они организуют эти идеи в меньшее количество более широких тем. Наконец, они пишут теоретическое повествование .- интерпретация - данных с точки зрения тем, которые они определили. Это теоретическое повествование фокусируется на субъективном опыте участников и обычно подтверждается множеством прямых цитат самих участников.


В качестве примера рассмотрим исследование Лауры Абрамс и Лауры Карран, которые использовали подход обоснованной теории для изучения опыта симптомов послеродовой депрессии у матерей с низким доходом (Abrams & Curran, 2009). Абрамс, Л.С., и Карран, Л. (2009). — И ты говоришь мне не напрягаться? Обоснованное теоретическое исследование симптомов послеродовой депрессии у малообеспеченных матерей. Psychology of Women Quarterly, 33 , 351–362. Их данные стали результатом неструктурированных интервью с 19 участниками. Таблица 7.1 «Темы и повторяющиеся идеи в исследовании послеродовой депрессии среди малообеспеченных матерей»показаны пять общих тем, которые определили исследователи, и более конкретные повторяющиеся идеи, составляющие каждую из этих тем. В своем исследовательском отчете они приводят многочисленные цитаты своих участников, например, эту из «Судьбы»:


Ну, совсем недавно в мою квартиру вломились, и тот факт, что его Medicaid по какой-то причине был отменен, так что за последние две недели произошло много всего одновременно. Так что сам по себе я не хочу сказать, что чуть не свел меня с ума, но это привело меня в ступор… Как будто я действительно был в депрессии. (стр. 357)


Их теоретическое повествование было сосредоточено на переживании участниками своих симптомов не как на абстрактном «аффективном расстройстве», а как на тесно связанном с ежедневной борьбой за воспитание детей в одиночестве в зачастую трудных обстоятельствах.


Таблица 7.1 . Темы и повторяющиеся идеи в исследовании послеродовой депрессии среди малообеспеченных матерей


Тема Повторяющиеся идеи

Амбивалентность «Я не была готова к этому ребенку», «Я не хотела больше иметь детей».

Перегрузка по уходу «Пожалуйста, перестань плакать», «Мне нужен перерыв», «Я больше не могу».

Жонглирование «Нет времени дышать», «Все зависит от меня», «Навигация по лабиринту».

Материнство в одиночестве «У меня действительно нет никакой помощи», «У моего ребенка нет отца».

Беспокойство в реальной жизни «У меня нет денег», «С моим ребенком все будет в порядке?» — Здесь небезопасно.

Количественно-качественный «дебат»

Учитывая их различия, неудивительно, что количественные и качественные исследования в психологии и смежных областях не сосуществуют в полной гармонии. Некоторые количественные исследователи критикуют качественные методы на том основании, что им не хватает объективности, их трудно оценить с точки зрения надежности и достоверности и что они не допускают обобщения на людей или ситуации, отличные от реально изучаемых. В то же время некоторые качественные исследователи критикуют количественные методы на том основании, что они упускают из виду богатство человеческого поведения и опыта и вместо этого отвечают на простые вопросы о легко поддающихся количественному определению переменных.


Однако в целом качественные исследователи хорошо осведомлены о вопросах объективности, надежности, валидности и обобщаемости. На самом деле они разработали ряд рамок для решения этих вопросов (которые выходят за рамки нашего обсуждения). Да и вообще количественные исследователи хорошо осведомлены о проблеме чрезмерного упрощения. Они не верят, что все человеческое поведение и опыт могут быть адекватно описаны в терминах небольшого числа переменных и статистических взаимосвязей между ними. Вместо этого они используют упрощение как стратегию раскрытия общих принципов человеческого поведения.


Многие исследователи как из количественного, так и из качественного лагеря теперь согласны с тем, что эти два подхода могут и должны быть объединены в то, что стало называться исследованием смешанных методов (Todd, Nerlich, McKeown, & Clarke, 2004). Тодд, З., Нерлих, Б., Маккеун, С., и Кларк, Д. Д. (2004) Методы смешивания в психологии: интеграция качественных и количественных методов в теории и практике . Лондон, Великобритания: Psychology Press.(На самом деле исследования Линдквиста и его коллег, а также Абрамса и Каррана сочетали количественный и качественный подходы.) Один из подходов к объединению количественных и качественных исследований заключается в использовании качественных исследований для выработки гипотез и количественных исследований для проверки гипотез. Опять же, в то время как качественное исследование может предположить, что семьям, пережившим неожиданное самоубийство, сложнее ответить на вопрос, почему, хорошо спланированное количественное исследование может проверить гипотезу, измеряя эти конкретные переменные для большой выборки. Второй подход к объединению количественных и качественных исследований называется триангуляцией .. Идея заключается в одновременном использовании количественных и качественных методов для изучения одних и тех же общих вопросов и сравнения результатов. Если результаты количественного и качественного методов сходятся к одному и тому же общему выводу, они усиливают и обогащают друг друга. Если результаты расходятся, то возникает новый интересный вопрос: почему результаты расходятся и как их можно согласовать?


КЛЮЧЕВЫЕ ВЫВОДЫ

Качественные исследования являются важной альтернативой количественным исследованиям в психологии. Обычно это включает в себя постановку более широких исследовательских вопросов, сбор более подробных данных (например, интервью) и использование нестатистического анализа.

Многие исследователи рассматривают количественные и качественные исследования как взаимодополняющие и выступают за их объединение. Например, качественные исследования можно использовать для выдвижения гипотез, а количественные исследования — для их проверки.

УПРАЖНЕНИЕ

Обсуждение: Чем качественное исследование девочек, играющих в юношеский бейсбол, может отличаться от количественного исследования той же темы?





Комплексные исследовательские проекты

Исследователя Симону Шнал и ее коллег интересовало, вызывает ли физическое отвращение людей к более суровым моральным суждениям (Schnall, Haidt, Clore, & Jordan, 2008). Шналл, С., Хайдт, Дж., Клор, Г.Л., и Джордан, А.Х. (2008). Отвращение как воплощенное моральное суждение. Бюллетень личности и социальной психологии , 34 , 1096–1109.Они провели эксперимент, в котором манипулировали чувством отвращения участников, проверяя их либо в чистой комнате, либо в грязной комнате, где были грязные тарелки, переполненная корзина для мусора и изжеванная ручка. Они также использовали анкету самоотчета, чтобы измерить количество внимания, которое люди уделяют своим телесным ощущениям. Они назвали это «частным телесным сознанием». Они измерили свою первичную зависимую переменную, жесткость моральных суждений людей, описав различные варианты поведения (например, поедание мертвой собаки, невозврат найденного кошелька) и попросив участников оценить моральную приемлемость каждого из них по шкале от 1 до 7. Они также измерили некоторые другие зависимые переменные, в том числе готовность участников поесть в новом ресторане. Окончательно, исследователи попросили участников оценить текущий уровень отвращения и других эмоций. Основные результаты этого исследования заключались в том, что участники в грязной комнате на самом деле испытывали большее отвращение и выносили более суровые моральные суждения, чем участники в чистой комнате, но только в том случае, если они набирали относительно высокие баллы по сознанию собственного тела.


Планы исследований, которые мы рассматривали до сих пор, были простыми — они фокусировались на вопросе об одной переменной или о статистической взаимосвязи между двумя переменными. Но во многом сложный план эксперимента, предпринятого Шналль и ее коллегами, более типичен для исследований в области психологии. К счастью, мы уже рассмотрели основные элементы таких конструкций в предыдущих главах. В этой главе мы подробно рассмотрим, как и почему исследователи комбинируют эти базовые элементы в более сложные конструкции. Мы начинаем со сложных экспериментов, рассматривая сначала включение нескольких зависимых переменных, а затем включение нескольких независимых переменных. Наконец, мы рассмотрим сложные корреляционные схемы.


8.1 Несколько зависимых переменных

ЦЕЛИ ОБУЧЕНИЯ

Объясните, почему исследователи часто включают в свои исследования несколько зависимых переменных.

Объясните, что такое проверка манипулирования и когда она будет включена в эксперимент.

Представьте, что вы приложили усилия, чтобы найти тему исследования, просмотреть исследовательскую литературу, сформулировать вопрос, спланировать эксперимент, получить одобрение институционального контрольного совета (IRB), набрать участников исследования и манипулировать независимой переменной. Было бы почти расточительно измерять одну зависимую переменную. Даже если вас в первую очередь интересует взаимосвязь между независимой переменной и одной первичной зависимой переменной, обычно есть еще несколько вопросов, на которые вы можете легко ответить, включив несколько зависимых переменных .


Меры различных конструкций

Часто исследователь хочет знать, как независимая переменная влияет на несколько различных зависимых переменных. Например, Шналл и ее коллеги интересовались тем, как чувство отвращения влияет на жесткость моральных суждений людей, но им также было любопытно, как отвращение влияет на другие переменные, например на готовность людей поесть в ресторане. В качестве другого примера исследовательницу Сьюзан Кнаско интересовало, как разные запахи влияют на поведение людей (Кнаско, 1992). Кнаско, Южная Каролина (1992). Влияние окружающего запаха на творчество, настроение и воспринимаемое здоровье. Химические чувства , 17 , 27–35.Она провела эксперимент, в котором независимой переменной было то, проходили ли участники тестирование в комнате без запаха или в комнате, ароматизированной лимоном, лавандой или диметилсульфидом (имеющим запах капусты). Хотя в первую очередь ее интересовало, как запахи влияют на творческие способности людей, ей также было любопытно, как они влияют на настроение людей и их самочувствие — и измерить эти зависимые переменные тоже было достаточно просто. Хотя она обнаружила, что окружающий запах не влиял на творческие способности, она обнаружила, что настроение людей было ниже в состоянии диметилсульфида, а их воспринимаемое здоровье было лучше в состоянии лимона.


Когда эксперимент включает в себя несколько зависимых переменных, снова существует возможность эффекта переноса. Например, возможно, что измерение настроения участников перед измерением их воспринимаемого здоровья может повлиять на их предполагаемое здоровье или измерение их предполагаемого здоровья до того, как их настроение может повлиять на их настроение. Поэтому порядок, в котором измеряются несколько зависимых переменных, становится проблемой. Один из подходов состоит в том, чтобы измерять их в одном и том же порядке для всех участников — обычно с самым важным первым, чтобы на него не повлияло измерение других. Другой подход заключается в уравновешивании или систематическом изменении порядка измерения зависимых переменных.


Проверка манипуляций

Когда независимая переменная является конструкцией, которой можно манипулировать только косвенно, например, эмоциями и другими внутренними состояниями, часто включается дополнительная мера этой независимой переменной в качестве проверки манипулирования . Это делается для подтверждения того, что с независимой переменной действительно успешно манипулировали. Например, Шналль и ее коллеги попросили участников оценить уровень своего отвращения, чтобы убедиться, что те, кто находился в грязной комнате, на самом деле чувствовали большее отвращение, чем те, кто находился в чистой комнате. Проверка манипуляции обычно проводится в конце процедуры, чтобы убедиться, что эффект от манипуляции сохраняется на протяжении всей процедуры, и чтобы не привлекать ненужного внимания к манипуляции.


Проверки манипулирования становятся особенно важными, когда оказывается, что манипулирование независимой переменной не влияет на зависимую переменную. Представьте, например, что вы показывали участникам счастливую или грустную музыку из фильмов, намереваясь вызвать у них радостное или грустное настроение, но обнаружили, что это никак не повлияло на количество счастливых или грустных детских событий, которые они вспомнили. Это может быть связано с тем, что счастливое или грустное настроение не влияет на воспоминания о событиях детства. Но также могло случиться так, что музыка была неэффективна для создания у участников радостного или грустного настроения. Проверка манипуляции — в данном случае мера настроения участников — помогла бы устранить эту неопределенность. Если бы он показал, что вы успешно манипулировали настроением участников, то оказалось бы, что влияние настроения на воспоминания о детских событиях действительно отсутствует.


Меры той же конструкции

Другим распространенным подходом к включению нескольких зависимых переменных является оперативное определение и измерение одной и той же или тесно связанных конструкций разными способами. Представьте, например, что исследователь проводит эксперимент по влиянию ежедневных физических упражнений на стресс. Зависимая переменная, стресс, является конструктом, который может быть операционально определен различными способами. По этой причине исследователь может попросить участников заполнить бумажно-карандашную шкалу воспринимаемого стресса и измерить уровень гормона стресса кортизола. Это пример использования сходящихся операций. Если исследователь обнаружит, что упражнения одинаково влияют на разные показатели, то он или она может быть уверен в выводе, что упражнения влияют на более общую структуру стресса.


Когда несколько зависимых переменных являются разными показателями одной и той же конструкции, особенно если они измеряются по одной и той же шкале, у исследователей есть возможность объединить их в одну меру этой конструкции. Напомним, что Шналль и ее коллег интересовала жесткость моральных суждений людей. Чтобы измерить эту конструкцию, они представили своим участникам семь различных сценариев, описывающих морально сомнительное поведение, и попросили их оценить моральную приемлемость каждого из них. Хотя они могли рассматривать каждый из семи рейтингов как отдельную зависимую переменную, эти исследователи объединили их в одну зависимую переменную, вычислив их среднее значение.


Когда исследователи комбинируют зависимые переменные таким образом, они рассматривают их вместе как меру множественных ответов одной конструкции. Преимущество этого заключается в том, что меры с множественными ответами, как правило, более надежны, чем меры с одним ответом. Однако важно убедиться, что отдельные зависимые переменные коррелируют друг с другом, вычислив внутреннюю меру согласованности, такую ​​как α Кронбаха. Если они не соотнесены друг с другом, то нет смысла объединять их в меру единого конструкта. Если они имеют плохую внутреннюю согласованность, то их следует рассматривать как отдельные зависимые переменные.


КЛЮЧЕВЫЕ ВЫВОДЫ

Исследователи в области психологии часто включают в свои исследования несколько зависимых переменных. Основная причина заключается в том, что это позволяет им легко ответить на большее количество исследовательских вопросов с минимальными дополнительными усилиями.

Когда независимая переменная является конструкцией, с которой манипулируют косвенно, рекомендуется включить проверку манипулирования. Это мера независимой переменной, которую обычно дают в конце процедуры, чтобы подтвердить, что ею успешно манипулировали.

Несколько мер одной и той же конструкции можно анализировать по отдельности или объединять для получения одной многоэлементной меры этой конструкции. Последний подход требует, чтобы меры, принимаемые вместе, имели хорошую внутреннюю согласованность.

УПРАЖНЕНИЯ

Практика: перечислите три независимые переменные, для которых было бы хорошо включить проверку манипулирования. Перечислите три других, для которых проверка манипулирования не требуется.

Практика: представьте себе исследование, в котором независимой переменной является температура в помещении, в котором тестируются участники, (80°) или прохлада (65°). Перечислите три зависимые переменные, которые вы могли бы рассматривать как меры отдельных переменных. Перечислите еще три, которые вы могли бы объединить и рассматривать как показатели одной и той же базовой конструкции.

8.2 Несколько независимых переменных

ЦЕЛИ ОБУЧЕНИЯ

Объясните, почему исследователи часто включают в свои исследования несколько независимых переменных.

Дайте определение факторному плану и используйте таблицу факторного плана для представления и интерпретации простых факторных планов.

Различать основные эффекты и взаимодействия, узнавать и приводить примеры каждого из них.

Нарисуйте и интерпретируйте гистограммы и линейные графики, показывающие результаты исследований с простыми факторными схемами.

Подобно тому, как исследования в области психологии обычно включают несколько зависимых переменных, они также часто включают несколько независимых переменных. Шналл и ее коллеги изучали влияние как отвращения, так и сознания частного тела в одном и том же исследовании. Включение исследователями нескольких независимых переменных в один эксперимент дополнительно иллюстрируется следующими фактическими заголовками из различных профессиональных журналов:


Влияние временной задержки и ориентации на тактильное распознавание объектов

Открытие закрытых умов: комбинированное влияние межгруппового контакта и потребности в закрытии на предрассудки

Влияние ожиданий и преодоления на вызванное болью намерение закурить

Влияние возраста и рассеянного внимания на спонтанное узнавание

Влияние уменьшенного размера продуктов питания и размера упаковки на потребительское поведение сдержанных и безудержных едоков

Точно так же, как включение нескольких зависимых переменных в один и тот же эксперимент позволяет ответить на большее количество вопросов исследования, то же самое можно сказать и о включении в один и тот же эксперимент нескольких независимых переменных. Например, вместо того, чтобы проводить одно исследование влияния отвращения на моральное суждение, а другое — влияние сознания частного тела на моральное суждение, Шналль и его коллеги смогли провести одно исследование, в котором были рассмотрены оба вопроса. Но включение нескольких независимых переменных также позволяет исследователю ответить на вопросы о том, зависит ли влияние одной независимой переменной от уровня другой. Это называется взаимодействием между независимыми переменными. Шналль и ее коллеги, например, наблюдали взаимодействие между отвращением и сознанием частного тела, потому что эффект отвращения зависел от того, были ли у участников высокие или низкие уровни сознания частного тела. Как мы увидим, взаимодействия часто являются одним из самых интересных результатов психологических исследований.


Факторные планы

Обзор

На сегодняшний день наиболее распространенным подходом к включению нескольких независимых переменных в эксперимент является факторный план. В факторном плане каждый уровень одной независимой переменной (которую также можно назвать фактором ) комбинируется с каждым уровнем других для получения всех возможных комбинаций. Таким образом, каждая комбинация становится условием эксперимента. Представьте, например, эксперимент по влиянию использования мобильного телефона (да или нет) и времени суток (день или ночь) на способность управлять автомобилем. Это показано в таблице факторного плана на рисунке 8.2 «Таблица факторного плана, представляющая факторный план 2 × 2».. Столбцы таблицы представляют использование сотового телефона, а строки — время суток. Четыре ячейки таблицы представляют четыре возможные комбинации или условия: использование сотового телефона днем, неиспользование сотового телефона днем, использование сотового телефона ночью и неиспользование сотового телефона ночью. Этот конкретный план представляет собой факторный план 2 × 2 (читай «два на два»), поскольку он объединяет две переменные, каждая из которых имеет два уровня. Если бы одна из независимых переменных имела третий уровень (например, использование портативного сотового телефона, использование сотового телефона с функцией громкой связи и отсутствие использования сотового телефона), то это был бы факторный план 3 × 2, и было бы шесть различных условий. Обратите внимание, что количество возможных условий равно произведению количества уровней. Факторный план 2 × 2 имеет четыре условия:


Рисунок 8.2 Таблица факторного плана, представляющая факторный план 2 × 2



В принципе, факторные планы могут включать любое количество независимых переменных с любым количеством уровней. Например, эксперимент может включать тип психотерапии (когнитивная или поведенческая), продолжительность психотерапии (2 недели или 2 месяца) и пол психотерапевта (женщина или мужчина). Это будет факторный план 2 × 2 × 2 с восемью условиями. Рисунок 8.3 «Таблица факторного плана, представляющая факторный план 2 × 2 × 2»показывает один из способов представления этого дизайна. На практике необычно наличие более трех независимых переменных с более чем двумя или тремя уровнями каждая, потому что количество условий может быстро стать неуправляемым. Например, добавление четвертой независимой переменной с тремя уровнями (например, опыт терапевта: низкий, средний или высокий) к текущему примеру сделает его факторным планом 2 × 2 × 2 × 3 с 24 различными условиями. В оставшейся части этого раздела мы сосредоточимся на планах с двумя независимыми переменными. Обсуждаемые здесь общие принципы напрямую распространяются на более сложные факторные планы.


Рисунок 8.3 Таблица факторного плана, представляющая факторный план 2 × 2 × 2



Назначение участников условиям

Напомним, что в простом межсубъектном исследовании каждый участник тестируется только в одном условии. В простом внутрисубъектном дизайне каждый участник тестируется во всех условиях. В факторном эксперименте решение о межсубъектном или внутрисубъектном подходе должно приниматься отдельно для каждой независимой переменной. В межсубъектном факторном плане все независимые переменные манипулируются между субъектами. Например, всех участников можно было протестировать либо при использовании сотового телефона , либо при его отсутствии, а также днем ​​или ночью. Это означало бы, что каждый участник был протестирован в одном и только одном состоянии. Внутрисубъектный факторный план, все независимые переменные манипулируются внутри субъектов. Всех участников можно было протестировать как с мобильным телефоном , так и без него, а также днем ​​и ночью. Это означало бы, что каждый участник был протестирован во всех условиях. Преимущества и недостатки этих двух подходов аналогичны рассмотренным в главе 6 «Экспериментальные исследования» . План между субъектами концептуально проще, позволяет избежать эффектов переноса и сводит к минимуму время и усилия каждого участника. Внутрисубъектный план более эффективен для исследователя и контролирует посторонние переменные участников.


Также можно манипулировать одной независимой переменной между субъектами и другой внутри субъектов. Это называется смешанным факторным планом . Например, исследователь может рассматривать использование сотового телефона как внутренний фактор, тестируя одних и тех же участников как при использовании сотового телефона, так и при его отсутствии (уравновешивая порядок этих двух условий). Но он или она может рассматривать время суток как фактор между испытуемыми, проверяя каждого участника либо днем, либо ночью (возможно, потому, что для этого требуется, чтобы они пришли на тестирование только один раз). Таким образом, каждый участник этого смешанного плана будет протестирован в двух из четырех условий.


Независимо от того, является ли дизайн межсубъектным, внутрисубъектным или смешанным, фактическое назначение участников условиям или порядкам условий обычно осуществляется случайным образом.


Неманипулируемые независимые переменные

Во многих факторных планах одной из независимых переменных является неманипулируемая независимая переменная . Исследователь измеряет его, но не манипулирует им. Исследование Шналля и его коллег является хорошим примером. Одной независимой переменной было отвращение, которым исследователи манипулировали, тестируя участников в чистой или грязной комнате. Другим было собственное телесное сознание, которое исследователи просто измерили. Другим примером является исследование, проведенное Холли Браун и его коллегами, в котором участникам показывали несколько слов, которые позже их просили вспомнить (Brown, Kosslyn, Delamater, Fama, & Barsky, 1999). Браун, Х.Д., Косслин, С.М., Деламатер, Б., Фама, А., и Барски, А.Дж. (1999). Предубеждения восприятия и памяти для информации, связанной со здоровьем, у ипохондриков.Журнал психосоматических исследований , 47 , 67–78. Независимой переменной, которой манипулировали, был тип слова. Некоторые из них были негативными словами, связанными со здоровьем (например, опухоль , коронарная болезнь ), а другие не имели отношения к здоровью (например, выборы , геометрия ). Неманипулируемая независимая переменная заключалась в том, были ли у участников высокие или низкие показатели ипохондрии (чрезмерная озабоченность обычными телесными симптомами). Результатом этого исследования стало то, что участники с высоким уровнем ипохондрии лучше, чем участники с низким уровнем ипохондрии, вспоминали слова, связанные со здоровьем, но они не лучше вспоминали слова, не связанные со здоровьем.


Такие исследования чрезвычайно распространены, и в отношении них стоит отметить несколько моментов. Во-первых, неманипулируемые независимые переменные обычно являются переменными-участниками (собственное телесное сознание, ипохондрия, самооценка и т. д.), и как таковые они по определению являются межсубъектными факторами. Например, у людей либо низкий уровень ипохондрии, либо высокий уровень ипохондрии; они не могут быть испытаны в обоих этих условиях. Во-вторых, такие исследования обычно считаются экспериментами до тех пор, пока манипулируют хотя бы одной независимой переменной, независимо от того, сколько неманипулируемых независимых переменных включено. В-третьих, важно помнить, что причинно-следственные выводы могут быть сделаны только относительно независимой переменной, которой манипулируют. Например, Шналл и ее коллеги справедливо пришли к выводу, что отвращение повлияло на резкость моральных суждений их участников, потому что они манипулировали этой переменной и случайным образом распределяли участников в чистую или грязную комнату. Но у них не было бы оснований заключить, что сознание личного тела участников влияет на жесткость моральных суждений их участников, потому что они не манипулировали этой переменной. Например, может быть, что строгий моральный кодекс и повышенное внимание к своему телу вызваны какой-то третьей переменной (например, невротизмом). Таким образом, важно знать, какие переменные в исследовании манипулируются, а какие нет. Но у них не было бы оснований заключить, что сознание личного тела участников влияет на жесткость моральных суждений их участников, потому что они не манипулировали этой переменной. Например, может быть, что строгий моральный кодекс и повышенное внимание к своему телу вызваны какой-то третьей переменной (например, невротизмом). Таким образом, важно знать, какие переменные в исследовании манипулируются, а какие нет. Но у них не было бы оснований заключить, что сознание личного тела участников влияет на жесткость моральных суждений их участников, потому что они не манипулировали этой переменной. Например, может быть, что строгий моральный кодекс и повышенное внимание к своему телу вызваны какой-то третьей переменной (например, невротизмом). Таким образом, важно знать, какие переменные в исследовании манипулируются, а какие нет.


Графики результатов факторных экспериментов

Результаты факторных экспериментов с двумя независимыми переменными можно изобразить в виде графика, представив одну независимую переменную на оси X, а другую — с помощью различных видов столбиков или линий . ( Ось Y всегда зарезервирована для зависимой переменной.) На рис. 8.4 «Два способа построения графика результатов факторного эксперимента с двумя независимыми переменными» показаны результаты двух гипотетических факторных экспериментов. На верхней панели показаны результаты дизайна 2 × 2. Время дня (день или ночь) представлено разными точками на оси X , а использование сотового телефона (нет или да) представлено полосами разного цвета. (Также можно представить использование сотового телефона на x-ось и время суток в виде полос разного цвета. Выбор сводится к тому, какой способ наиболее четко передает результаты.) Нижняя часть рисунка 8.4 «Два способа построения графика результатов факторного эксперимента с двумя независимыми переменными» показывает результаты плана 4 × 2, в котором одна переменных является количественным. Эта переменная, продолжительность психотерапии, представлена ​​по оси абсцисс , а другая переменная (тип психотерапии) представлена ​​линиями другого формата. Это линейный график, а не гистограмма, потому что переменная на оси X является количественной с небольшим количеством различных уровней.


Рис. 8.4 . Два способа построения графика результатов факторного эксперимента с двумя независимыми переменными



Основные эффекты и взаимодействия

В факторных планах интерес представляют два вида результатов: основные эффекты и эффекты взаимодействия (которые также называются просто «взаимодействиями»). Основным эффектом является статистическая связь между одной независимой переменной и зависимой переменной — усреднение по уровням другой независимой переменной. Таким образом, для каждой независимой переменной в исследовании необходимо учитывать один основной эффект. Верхняя панель рисунка 8.4 «Два способа построения графика результатов факторного эксперимента с двумя независимыми переменными».показывает основной эффект использования мобильных телефонов, поскольку эффективность вождения в среднем была выше, когда участники не использовали мобильные телефоны, чем когда они ими пользовались. Синие столбцы в среднем выше красных. Он также показывает основное влияние времени суток, поскольку эффективность вождения днем ​​была лучше, чем ночью — как тогда, когда участники использовали мобильные телефоны, так и когда они не пользовались ими. Основные эффекты не зависят друг от друга в том смысле, что наличие или отсутствие основного эффекта одной независимой переменной ничего не говорит о наличии основного эффекта другой. Нижняя панель рисунка 8.4 «Два способа построения графика результатов факторного эксперимента с двумя независимыми переменными»., например, показывает явный основной эффект продолжительности психотерапии. Чем дольше психотерапия, тем лучше она работала. Но это также не показывает общего преимущества одного типа психотерапии над другим.


Существует взаимодействиеэффект (или просто «взаимодействие»), когда эффект одной независимой переменной зависит от уровня другой. Хотя это может показаться сложным, у вас уже есть интуитивное понимание взаимодействий. Вас, вероятно, не удивит, например, если вы услышите, что эффект от психотерапии сильнее у людей, сильно мотивированных к изменению, чем у людей, не мотивированных к изменению. Это взаимодействие, потому что эффект одной независимой переменной (независимо от того, получает человек психотерапию или нет) зависит от уровня другой (мотивации к изменению). Шналл и ее коллеги также продемонстрировали взаимодействие, потому что влияние того, была ли комната чистой или грязной, на моральные суждения участников зависело от того, было ли у участников низкое или высокое сознание собственного тела. Если у них было высокое сознание собственного тела, то те, кто находился в грязной комнате, выносили более суровые суждения. Если у них было низкое сознание частного тела, тогда не имело значения, была ли комната чистой или грязной.


Влияние одной независимой переменной может по-разному зависеть от уровня другой. Это показано на рис. 8.5 «Гистограммы, показывающие три типа взаимодействий».. На верхней панели одна независимая переменная влияет на один уровень второй независимой переменной, но не влияет на другие. (Это очень похоже на исследование Шналль и ее коллег, где эффект отвращения наблюдался у тех, у кого было высокое сознание частного тела, но не у тех, у кого было низкое сознание частного тела.) На средней панели одна независимая переменная оказывает более сильное влияние на на один уровень второй независимой переменной, чем на другой уровень. Это похоже на пример с гипотетическим вождением, где эффект от использования сотового телефона ночью был сильнее, чем днем. На нижней панели одна независимая переменная снова оказывает влияние на оба уровня второй независимой переменной, но эти эффекты имеют противоположные направления. Рисунок 8.5 «Гистограммы, показывающие три типа взаимодействий»показывает самую сильную форму такого взаимодействия, называемую перекрестным взаимодействием . Одним из примеров перекрестного взаимодействия является исследование Кэти Гиллиланд о влиянии кофеина на результаты вербальных тестов интровертов и экстравертов (Гиллиленд, 1980). Гиллиленд, К. (1980). Интерактивный эффект интроверсии-экстраверсии с возбуждением, вызванным кофеином, на вербальные действия. Журнал исследований личности , 14 , 482–492. Интроверты работают лучше, чем экстраверты, когда не употребляют кофеин. Но экстраверты работают лучше, чем интроверты, когда они потребляют 4 мг кофеина на килограмм веса тела. Рисунок 8.6 «Линейные графики, показывающие три типа взаимодействий»показывает примеры таких же взаимодействий, когда одна из независимых переменных является количественной, а результаты нанесены на линейный график. Обратите внимание, что при перекрестном взаимодействии две линии буквально «перекрещиваются» друг с другом.


Рисунок 8.5 Гистограммы, показывающие три типа взаимодействий



На верхней панели одна независимая переменная влияет на один уровень второй независимой переменной, но не на другой. На средней панели одна независимая переменная оказывает более сильное влияние на один уровень второй независимой переменной, чем на другой. На нижней панели одна независимая переменная оказывает противоположное влияние на один уровень второй независимой переменной, чем на другой.


Рисунок 8.6 . Линейные графики, показывающие три типа взаимодействий



На верхней панели одна независимая переменная влияет на один уровень второй независимой переменной, но не на другой. На средней панели одна независимая переменная оказывает более сильное влияние на один уровень второй независимой переменной, чем на другой. На нижней панели одна независимая переменная оказывает противоположное влияние на один уровень второй независимой переменной, чем на другой.


Во многих исследованиях основной исследовательский вопрос касается взаимодействия. Исследование Браун и ее коллег было вдохновлено идеей о том, что люди с ипохондрией особенно внимательно относятся к любой негативной информации, связанной со здоровьем. Это привело к гипотезе о том, что люди с высоким уровнем ипохондрии будут вспоминать негативные слова, связанные со здоровьем, более точно, чем люди с низким уровнем ипохондрии, но помнят слова, не связанные со здоровьем, примерно так же, как люди с низким уровнем ипохондрии. И, конечно же, именно это и произошло в этом исследовании.


КЛЮЧЕВЫЕ ВЫВОДЫ

Исследователи часто включают в свои эксперименты несколько независимых переменных. Наиболее распространенным подходом является факторный план, в котором каждый уровень одной независимой переменной комбинируется с каждым уровнем других для создания всех возможных условий.

В факторном плане основным эффектом независимой переменной является ее общий эффект, усредненный по всем другим независимым переменным. Для каждой независимой переменной существует один главный эффект.

Существует взаимодействие между двумя независимыми переменными, когда эффект одной зависит от уровня другой. Некоторые из наиболее интересных исследовательских вопросов и результатов в психологии касаются именно взаимодействия.

УПРАЖНЕНИЯ

Практика: Вернитесь к пяти названиям статей, представленным в начале этого раздела. Для каждого определите независимые переменные и зависимую переменную.

Практика: создайте таблицу факторных расчетов для эксперимента по влиянию комнатной температуры и уровня шума на производительность SAT. Обязательно укажите, будет ли изменяться каждая независимая переменная между испытуемыми или внутри испытуемых, и объясните, почему.

8.3 Сложные корреляционные планы

ЦЕЛИ ОБУЧЕНИЯ

Объясните некоторые причины, по которым исследователи используют сложные корреляционные схемы.

Создайте и интерпретируйте матрицу корреляции.

Опишите, как исследователи могут использовать корреляционное исследование для изучения причинно-следственных связей между переменными, включая ограничения этого подхода.

Как мы уже видели, исследователи проводят корреляционные исследования, а не эксперименты, когда их интересуют непричинные отношения или когда они интересуются причинными отношениями, где независимой переменной нельзя манипулировать по практическим или этическим причинам. В этом разделе мы рассмотрим некоторые подходы к сложным корреляционным исследованиям, которые включают измерение нескольких переменных и оценку взаимосвязей между ними.


Корреляционные исследования с факторными планами

Мы уже видели, что факторные эксперименты могут включать в себя манипулируемые независимые переменные или комбинацию манипулируемых и неманипулируемых независимых переменных. Но факторные планы также могут включать тольконеманипулируемые независимые переменные, и в этом случае они уже не эксперименты, а корреляционные исследования. Рассмотрим гипотетическое исследование, в котором исследователь измеряет как настроение, так и самооценку нескольких участников, классифицируя их как имеющих позитивное или негативное настроение, а также как обладающих высокой или низкой самооценкой, а также их готовность к незащищенным действиям. половой акт. Это можно представить как факторный план 2 × 2 с настроением (положительное или отрицательное) и самооценкой (высокое или низкое) в качестве межсубъектных факторов. (Готовность к незащищенному сексу является зависимой переменной.) Этот план может быть представлен в таблице факторного плана, а результаты — в виде гистограммы, которую мы уже видели. Исследователь рассмотрит главный эффект секса, главный эффект самооценки,


Опять же, поскольку ни одна из независимых переменных в этом примере не подвергалась манипуляциям, это скорее корреляционное исследование, чем эксперимент. (Аналогичное исследование MacDonald and Martineau [2002] MacDonald, TK, & Martineau, AM (2002). Самооценка, настроение и намерения использовать презервативы: когда низкая самооценка приводит к опасному для здоровья поведению? Journal of Experimental Социальная психология, 38 , 299–306.был экспериментом, потому что они манипулировали настроением своих участников.) Это важно, потому что, как всегда, нужно быть осторожным в выводе причинно-следственной связи из корреляционных исследований из-за проблем направленности и третьей переменной. Например, основное влияние настроения участников на их готовность к незащищенному сексу может быть вызвано любой другой переменной, которая коррелирует с их настроением.


Оценка взаимосвязей между несколькими переменными

Однако самые сложные корреляционные исследования не вписываются точно в факторный план. Вместо этого он включает в себя измерение нескольких переменных — часто как категорийных, так и количественных — с последующей оценкой статистических взаимосвязей между ними. Например, исследователи Натан Рэдклифф и Уильям Кляйн изучили выборку взрослых людей среднего возраста, чтобы увидеть, как их уровень оптимизма (измеряемый с помощью короткого опросника под названием «Тест жизненной ориентации») связан с несколькими другими переменными, связанными с сердечным приступом (Рэдклифф). и Кляйн, 2002). Рэдклифф, Н. М., и Кляйн, WMP (2002). Диспозиционный, нереалистичный и сравнительный оптимизм: дифференциальные отношения со знанием и обработкой информации о риске и убеждениями о личном риске. Вестник Личности и Социальной Психологии , 28, 836–846. К ним относятся их здоровье, их знания о факторах риска сердечного приступа и их убеждения относительно собственного риска сердечного приступа. Они обнаружили, что более оптимистичные участники были здоровее (например, они больше тренировались и у них было более низкое кровяное давление), знали о факторах риска сердечного приступа и правильно полагали, что их собственный риск ниже, чем у их сверстников.


Этот подход часто используется для оценки достоверности новых психологических мер. Например, когда Джон Качиоппо и Ричард Петти создали свою шкалу потребности в познании — меру степени, в которой люди любят думать и ценят мышление, — они использовали ее для измерения потребности в познании у большой выборки студентов колледжей, а также три другие переменные: интеллект, социально желательная реакция (тенденция давать то, что человек считает «подходящей» реакцией) и догматизм (Caccioppo & Petty, 1982). Качиоппо, Дж. Т., и Петти, Р. Е. (1982). Потребность в познании. Журнал личности и социальной психологии, 42 , 116–131. Результаты этого исследования обобщены вТаблица 8.1 «Матрица корреляции, показывающая корреляции между потребностью в познании и тремя другими переменными на основе исследований Качиоппо и Петти» , которая представляет собой матрицу корреляции, показывающую корреляцию ( r Пирсона).) между всеми возможными парами переменных в исследовании. Например, корреляция между потребностью в познании и интеллектом была +,39, корреляция между интеллектом и социально желательным реагированием была -0,02 и так далее. (Заполняется только половина матрицы, потому что другая половина будет содержать точно такую ​​же информацию. Кроме того, поскольку корреляция между переменной и самой собой всегда +1,00, эти значения заменяются тире по всей матрице.) В этом случае общая картина корреляций согласовывалась с идеями исследователей о том, как оценки потребности в познании должны быть связаны с этими другими конструкциями.


Таблица 8.1 Матрица корреляции, показывающая корреляцию между потребностью в познании и тремя другими переменными на основе исследования Качиоппо и Петти


Потребность в познании Интеллект Социальная желательность Догматизм

Потребность в познании

Интеллект +0,39

Социальная желательность +0,08 +0,02

Догматизм −0,27 −0,23 +0,03

Когда исследователи изучают отношения между большим количеством концептуально сходных переменных, они часто используют сложную статистическую технику, называемую факторным анализом .. По сути, факторный анализ объединяет переменные в меньшее количество кластеров, так что они сильно коррелируют внутри каждого кластера, но слабо коррелируют между кластерами. Затем каждый кластер интерпретируется как несколько показателей одной и той же базовой конструкции. Эти лежащие в основе конструкции также называются «факторами». Например, когда люди выполняют широкий спектр умственных задач, факторный анализ обычно объединяет их в два основных фактора: один исследователи интерпретируют как математический интеллект (арифметика, количественная оценка, пространственное мышление и т. д.), а другой — как вербальный. интеллект (грамматика, понимание прочитанного, словарный запас и т. д.). Факторы личности «Большой пятерки» были определены с помощью факторного анализа оценок людей по большому количеству более специфических черт. Например, показатели теплоты, общительности, уровня активности и положительных эмоций, как правило, сильно коррелируют друг с другом и интерпретируются как представление конструкции экстраверсии. В качестве последнего примера исследователи Питер Рентфроу и Сэмюэл Гослинг попросили более 1700 студентов колледжей оценить, насколько им нравятся 14 различных популярных музыкальных жанров (Rentfrow & Gosling, 2008).Рентфроу, П.Дж., и Гослинг, С.Д. (2008). До-ре-ми повседневной жизни: структура и личностные корреляты музыкальных предпочтений. Журнал личности и социальной психологии , 84 , 1236–1256. Затем они подвергли эти 14 переменных факторному анализу, который выявил четыре различных фактора. Исследователи назвали их рефлексивными и сложными (блюз, джаз, классика и фолк), интенсивными и мятежными (рок, альтернатива и хэви-метал), оптимистичными и традиционными (кантри, саундтрек, религиозная, поп-музыка) и энергичными и ритмичными (рэп ). / хип-хоп, соул / фанк и электроника).


Здесь стоит сделать два дополнительных замечания о факторном анализе. Во-первых, факторы не являются категориями. Факторный анализ не говорит нам, что люди либо экстраверты , либо добросовестны, либо что им нравится либо «рефлексивная и сложная» музыка , либо«интенсивная и бунтарская» музыка. Вместо этого факторы представляют собой конструкции, действующие независимо друг от друга. Таким образом, люди с высоким уровнем экстраверсии могут иметь высокую или низкую сознательность, а люди, которым нравится задумчивая и сложная музыка, могут также любить или не любить интенсивную и бунтарскую музыку. Второй момент заключается в том, что факторный анализ раскрывает только основную структуру переменных. Исследователи должны интерпретировать и обозначать факторы, а также объяснять происхождение этой конкретной факторной структуры. Например, одна из причин того, что экстраверсия и другая «большая пятерка» действуют как отдельные факторы, заключается в том, что они, по-видимому, контролируются разными генами (Plomin, DeFries, McClean, & McGuffin, 2008). Пломин, Р., ДеФрис, Дж. К., Макклирн, GE, и Макгаффин, П. (2008). Поведенческая генетика(5-е изд.). Нью-Йорк, штат Нью-Йорк: Стоит.


Изучение причинно-следственных связей

Еще одно важное применение сложных корреляционных исследований — изучение возможных причинно-следственных связей между переменными. Это может показаться удивительным, учитывая, что «корреляция не подразумевает причинно-следственную связь». Это правда, что корреляционное исследование не может однозначно установить, что одна переменная вызывает другую. Однако комплексное корреляционное исследование часто может использоваться для исключения других правдоподобных интерпретаций.


Основным способом сделать это является статистический контроль потенциальных третьих переменных. Вместо того, чтобы контролировать эти переменные путем случайного назначения или удержания их постоянными, как в эксперименте, исследователь измеряет их и включает в статистический анализ. Рассмотрим некоторые исследования Пола Пиффа и его коллег, которые выдвинули гипотезу о том, что более низкий социально-экономический статус (СЭС) заставляет людей быть более щедрыми (Piff, Kraus, Côté, Hayden Cheng, & Keltner, 2011). Пифф, П.К., Краус, М.В., Котэ, С., Хайден Ченг, Б., и Кельтнер, Д. (2011). Имея меньше, отдавая больше: влияние социального класса на просоциальное поведение. Журнал личности и социальной психологии , 99 , 771–784.Они измерили SES своих участников и заставили их сыграть в «игру диктатора». Они сказали участникам, что каждый будет в паре с другим участником в другой комнате. (На самом деле другого участника не было.) Затем каждому участнику давали по 10 баллов (которые впоследствии можно было конвертировать в деньги), чтобы он делился с «партнером» так, как он решит. Поскольку участники были «диктаторами», они могли даже оставить себе все 10 баллов, если бы захотели.


Как и ожидали эти исследователи, участники с более низким SES, как правило, отдавали больше своих баллов, чем участники с более высоким SES. Это согласуется с идеей о том, что низкий уровень СЭС заставляет людей быть более щедрыми. Но есть также правдоподобные третьи переменные, которые могли бы объяснить эту взаимосвязь. Например, может случиться так, что люди с более низким СЭС, как правило, более религиозны, и именно их большая религиозность заставляет их быть более щедрыми. Или может случиться так, что люди с более низкими показателями СЭС, как правило, происходят из этнических групп, которые подчеркивают щедрость больше, чем представители других этнических групп. Однако исследователи справились с этими потенциальными третьими переменными, измерив их и включив в свой статистический анализ. Они обнаружили, что ни религиозность, ни этническая принадлежность не коррелируют с щедростью, и поэтому смогли исключить их как третьи переменные. Это не доказывает, что SES вызывает большую щедрость, потому что могут быть другие третьи переменные, которые исследователи не измеряли. Но, исключив некоторые из наиболее правдоподобных третьих переменных, исследователи убедительно обосновали SES как причину большей щедрости.


Во многих исследованиях этого типа используется статистический метод, называемый множественной регрессией . Это включает в себя измерение нескольких независимых переменных ( X 1 , X 2 , X 3 ,… X i ), все из которых являются возможными причинами одной зависимой переменной ( Y ). Результатом множественного регрессионного анализа является уравнение, выражающее зависимую переменную как аддитивную комбинацию независимых переменных. Это уравнение регрессии имеет следующий общий вид:


б 1 Икс 1 + б 2 Икс 2 + б 3 Икс 3 + … + б я Икс я знак равно Y .

Величины b 1 , b 2 и т. д. являются регрессионными весами, которые показывают, насколько велик вклад независимой переменной в среднем в зависимую переменную. В частности, они показывают, насколько изменяется зависимая переменная при каждом изменении независимой переменной на одну единицу.


Преимущество множественной регрессии заключается в том, что она может показать, вносит ли независимая переменная вклад в зависимую переменную сверх и выше .вклады других независимых переменных. В качестве гипотетического примера представьте, что исследователь хочет знать, как независимые переменные дохода и здоровья соотносятся с зависимой переменной счастья. Это сложно, потому что доход и здоровье сами по себе связаны друг с другом. Таким образом, если люди с более высокими доходами, как правило, счастливее, то, возможно, это происходит только потому, что они, как правило, более здоровы. Точно так же, если более здоровые люди, как правило, счастливее, возможно, это только потому, что они склонны зарабатывать больше денег. Но множественный регрессионный анализ, включающий и доход, и счастье как независимые переменные, покажет, вносит ли каждая из них вклад в счастье, когда принимается во внимание другая. (Кстати, подобные исследования показал, что и доход, и здоровье вносят чрезвычайно небольшой вклад в счастье, за исключением случаев крайней бедности или болезни; Динер, 2000.Динер, Э. (2000). Субъективное благополучие: наука о счастье и предложение по национальному индексу. Американский психолог , 55 , 34–43. )


Примеры, рассмотренные в этом разделе, лишь поверхностно показывают, как исследователи используют сложные корреляционные исследования для изучения возможных причинно-следственных связей между переменными. Однако важно иметь в виду, что чисто корреляционные подходы не могут однозначно установить, что одна переменная вызывает другую. Лучшее, что они могут сделать, — это показать паттерны отношений, которые согласуются с одними каузальными интерпретациями и несовместимы с другими.


КЛЮЧЕВЫЕ ВЫВОДЫ

Исследователи часто используют сложные корреляционные исследования для изучения взаимосвязей между несколькими переменными в одном и том же исследовании.

Комплексное корреляционное исследование может использоваться для изучения возможных причинно-следственных связей между переменными с использованием таких методов, как множественная регрессия. Такие планы могут показать закономерности отношений, которые согласуются с одними причинными интерпретациями и несовместимы с другими, но они не могут однозначно установить, что одна переменная вызывает другую.

УПРАЖНЕНИЯ

Практика: составьте корреляционную матрицу для гипотетического исследования, включающую такие переменные, как депрессия, тревога, самооценка и счастье. Включите значения r Пирсона, которые вы ожидаете.

Обсуждение: представьте себе корреляционное исследование, в котором изучается интеллект, потребность в познании и успеваемость старшеклассников на курсе критического мышления. Множественный регрессионный анализ показывает, что интеллект связан не с успеваемостью в классе, а с потребностью в познании. Объясните, что показало это исследование с точки зрения того, что является причиной хорошей успеваемости в курсе критического мышления.




Исследовательский опрос

Вскоре после терактов в Нью-Йорке и Вашингтоне, округ Колумбия, в сентябре 2001 года исследователь Дженнифер Лернер и ее коллеги провели в Интернете опрос почти 2000 американских подростков и взрослых в возрасте от 13 до 88 лет (Лернер, Гонсалес, Смолл и Фишхофф, 2003). Лернер, Дж. С., Гонсалес, Р. М., Смолл, Д. А., и Фишхофф, Б. (2003). Влияние страха и гнева на предполагаемые риски терроризма: национальный полевой эксперимент. Психологическая наука , 14 , 144–150.Они спросили участников об их реакции на нападения и их суждениях о различных связанных с терроризмом и других рисках. Среди результатов было то, что участники были склонны переоценивать большинство рисков, что женщины делали это чаще, чем мужчины, и что не было различий между подростками и взрослыми. Однако самый интересный результат был связан с тем фактом, что некоторые участники были «подготовлены» к чувству гнева, спрашивая их, что их злит в связи с нападениями, и предоставляя им фотографию и аудиоклип, предназначенные для того, чтобы вызвать гнев. Другие были настроены на страх, спрашивая их, что заставило их бояться нападений, и предоставляя им фотографию и аудиоклип, призванные вызвать страх. Как предположили исследователи,


Исследование Лернер и ее коллег является примером опроса в психологии — темы этой главы. Мы начнем с обзора опросного исследования, включая его определение, немного истории и немного о том, кто его проводит и почему. Затем мы рассматриваем ответы на опросы как психологический процесс и последствия этого для построения хороших анкет для опросов. Наконец, мы рассматриваем некоторые вопросы, связанные с фактическим проведением опроса, включая выборку участников и сбор данных.


9.1 Обзор опросных исследований

ЦЕЛИ ОБУЧЕНИЯ

Определить, что такое опросное исследование, включая две его важные характеристики.

Опишите несколько различных способов использования результатов опроса и приведите несколько примеров.

Что такое опросное исследование?

Опросное исследование представляет собой количественный подход, который имеет две важные характеристики. Во-первых, интересующие нас переменные измеряются с помощью самоотчетов. По сути, исследователи опроса спрашивают своих участников (которых часто называют респондентами )в опросных исследованиях) сообщать непосредственно о своих мыслях, чувствах и поведении. Во-вторых, значительное внимание уделяется вопросу выборки. В частности, исследователи, проводящие опросы, отдают предпочтение большим случайным выборкам, потому что они дают наиболее точные оценки того, что является истинным в популяции. На самом деле, опросное исследование может быть единственным подходом в психологии, в котором обычно используется случайная выборка. Помимо этих двух характеристик, в опросных исследованиях используется почти все. Опросы могут быть длинными или короткими. Они могут проводиться лично, по телефону, по почте или через Интернет. Они могут касаться намерений голосовать, потребительских предпочтений, социальных установок, здоровья или чего-либо еще, о чем можно спросить людей и получить содержательные ответы.


Большинство обзорных исследований не являются экспериментальными. Он используется для описания отдельных переменных (например, процент избирателей, предпочитающих того или иного кандидата в президенты, распространенность шизофрении среди населения в целом), а также для оценки статистических связей между переменными (например, связи между доходом и здоровьем). Но опросы могут быть и экспериментальными. Исследование Лернер и ее коллег является хорошим примером. Использование ими показателей самоотчетов и большой национальной выборки идентифицирует их работу как исследовательскую работу. Но их манипулирование независимой переменной (гнев против страха) для оценки ее влияния на зависимую переменную (оценку риска) также определяет их работу как экспериментальную.


История и использование опросных исследований

Опросное исследование может иметь свои корни в английских и американских «социальных опросах», проводившихся на рубеже 20-го века исследователями и реформаторами, которые хотели задокументировать масштабы социальных проблем, таких как бедность (Converse, 1987). Конверс, Дж. М. (1987). Обзорное исследование в Соединенных Штатах: корни и появление, 1890–1960 гг . Беркли, Калифорния: Издательство Калифорнийского университета.К 1930-м годам правительство США проводило исследования для документирования экономических и социальных условий в стране. Необходимость делать выводы обо всей совокупности способствовала развитию процедур выборки. Примерно в то же время несколько исследователей, уже сделавших себе имя в исследованиях рынка, изучая потребительские предпочтения американских предприятий, обратили свое внимание на опросы общественного мнения. Переломным событием стали президентские выборы 1936 года между Альфом Лэндоном и Франклином Рузвельтом. Журнал под названием « Литературный дайджест ».провела опрос, разослав бюллетени (которые также были запросами на подписку) миллионам американцев. Основываясь на этом «соломенном опросе», редакторы предсказали, что Лэндон победит с большим перевесом. В то же время новые социологи использовали научные методы с гораздо меньшими выборками, чтобы предсказать как раз обратное — что Рузвельт победит с большим перевесом. На самом деле, один из них, Джордж Гэллап, публично критиковал методы « Литературного дайджеста» перед выборами и почти гарантировал, что его прогноз будет верным. И, конечно, это было. (Мы рассмотрим причины, по которым Гэллап был прав, позже в этой главе.)


От маркетинговых исследований и опросов на выборах опросные исследования перекочевали в несколько академических областей, включая политологию, социологию и общественное здравоохранение, где они продолжают оставаться одним из основных подходов к сбору новых данных. Начиная с 1930-х годов психологи добились значительных успехов в разработке анкет, включая методы, которые используются до сих пор, такие как шкала Лайкерта. (См. «Что такое шкала Лайкерта?» в разделе 9.2 «Составление опросных листов»..) Опросное исследование имеет сильную историческую связь с социально-психологическим изучением взглядов, стереотипов и предубеждений. Ранние исследователи установок были также одними из первых психологов, которые искали более крупные и разнообразные выборки, чем удобные выборки студентов колледжей, которые обычно использовались в психологии (и до сих пор используются).


Опросные исследования продолжают играть важную роль в психологии и сегодня. Например, данные обследований сыграли важную роль в оценке распространенности различных психических расстройств и выявлении статистических взаимосвязей между этими расстройствами и различными другими факторами. Национальное обследование сопутствующих заболеваний — это крупномасштабное исследование психического здоровья, проводимое в Соединенных Штатах (см. http://www.hcp.med.harvard.edu/ncs ). Только в одной части этого опроса около 10 000 взрослых прошли структурированное интервью о психическом здоровье у себя дома в 2002 и 2003 гг .представлены результаты по распространенности некоторых тревожных, аффективных расстройств и расстройств, связанных с употреблением психоактивных веществ, в течение жизни. (Распространенность в течение жизни — это процент населения, у которого когда-либо в жизни возникает эта проблема.) Очевидно, что такого рода информация может быть очень полезной как для фундаментальных исследователей, стремящихся понять причины и корреляты психических расстройств, так и для клиницистов и политиков. которым необходимо точно знать, насколько распространены эти расстройства.


Таблица 9.1 . Некоторые результаты национального обследования сопутствующих заболеваний в отношении распространенности в течение жизни


Распространенность в течение жизни*

расстройство Общий женский Мужской

Генерализованное тревожное расстройство 5.7 7.1 4.2

Обсессивно-компульсивное расстройство 2.3 3.1 1,6

Сильное депрессивное расстройство 16,9 20,2 13.2

Биполярное расстройство 4.4 4,5 4.3

Злоупотребление алкоголем 13.2 7,5 19,6

Злоупотребление наркотиками 8,0 4,8 11,6

* Распространенность расстройства в течение жизни — это процент людей в популяции, у которых это расстройство развивается в любой момент их жизни.

И, как ясно из первого примера, опросные исследования можно даже использовать для проведения экспериментов по проверке конкретных гипотез о причинно-следственных связях между переменными. Такие исследования, когда они проводятся на больших и разнообразных выборках, могут быть полезным дополнением к лабораторным исследованиям, проводимым со студентами колледжей. Хотя это нетипичное использование опросного исследования, оно, безусловно, иллюстрирует гибкость этого подхода.


КЛЮЧЕВЫЕ ВЫВОДЫ

Опросное исследование представляет собой количественный подход, в котором используются меры самооценки на тщательно отобранных выборках. Это гибкий подход, который можно использовать для изучения широкого спектра фундаментальных и прикладных исследовательских вопросов.

Опросные исследования берут свое начало в прикладных социальных исследованиях, исследованиях рынка и опросах на выборах. С тех пор он стал важным подходом во многих академических дисциплинах, включая политологию, социологию, общественное здравоохранение и, конечно же, психологию.

УПРАЖНЕНИЕ

Обсуждение: подумайте о вопросе, на который каждый из следующих специалистов мог бы попытаться ответить с помощью опроса.


социальный психолог

исследователь в области образования

исследователь рынка, работающий в сети супермаркетов

мэр большого города

начальник университетской полиции

9.2 Составление опросных листов

ЦЕЛИ ОБУЧЕНИЯ

Опишите когнитивные процессы, связанные с ответом на вопрос опроса.

Объясните, что такое эффект контекста, и приведите несколько примеров.

Создайте простую анкету для опроса, основанную на принципах эффективного составления и организации вопросов.

Сердцевиной любого исследовательского проекта в области опроса является сама анкета. Хотя придумать интересные вопросы людям несложно, составить хорошую анкету для опроса совсем не просто. Проблема в том, что на ответы, которые дают люди, могут непреднамеренным образом повлиять формулировка вопросов, порядок вопросов, предоставленные варианты ответа и многие другие факторы. В лучшем случае эти влияния добавляют шум к данным. В худшем случае они приводят к систематическим искажениям и вводящим в заблуждение результатам. Поэтому в этом разделе мы рассмотрим некоторые принципы составления вопросников для обследования, чтобы свести к минимуму эти непреднамеренные эффекты и, таким образом, максимально повысить надежность и достоверность ответов респондентов.


Ответ на опрос как психологический процесс

Прежде чем рассматривать конкретные принципы построения вопросника для опроса, полезно рассмотреть ответы на опрос как психологический процесс.


Когнитивная модель

На рис. 9.1 «Модель когнитивных процессов, задействованных при ответе на вопрос опроса» представлена ​​модель когнитивных процессов, в которые вовлечены люди при ответе на вопрос опроса (Sudman, Bradburn, & Schwarz, 1996). Судман С., Брэдберн Н. М. и Шварц Н. (1996). Думая об ответах: применение когнитивных процессов в методологии опроса . Сан-Франциско, Калифорния: Джосси-Басс. Респонденты должны интерпретировать вопрос, извлечь соответствующую информацию из памяти, сформировать предварительное суждение, преобразовать предварительное суждение в один из предложенных вариантов ответа (например, оценку по шкале от 1 до 7) и, наконец, при необходимости отредактировать свой ответ. .


Рисунок 9.1 Модель когнитивных процессов, задействованных в ответе на вопрос опроса



Рассмотрим, например, следующий пункт анкеты:


Сколько алкогольных напитков вы обычно выпиваете в день?


_____ намного больше, чем в среднем

_____ несколько выше среднего

_____ средний

_____ несколько меньше, чем в среднем

_____ намного меньше, чем в среднем

Хотя этот пункт на первый взгляд кажется простым, он вызывает у респондентов ряд трудностей. Во-первых, они должны интерпретировать вопрос. Например, они должны решить, включают ли «алкогольные напитки» пиво и вино (а не только крепкие напитки) и является ли «обычный день» обычным будним днем, типичным выходным днем ​​или и тем, и другим. После того, как они интерпретировали вопрос, они должны извлечь соответствующую информацию из памяти, чтобы ответить на него. Но какую информацию они должны получить и как они должны ее получить? Они могут смутно размышлять о некоторых недавних случаях употребления алкоголя, они могут тщательно пытаться вспомнить и подсчитывать количество алкогольных напитков, которые они выпили на прошлой неделе, или они могут вспомнить некоторые существующие у них убеждения о себе (например, «Я мало пьющий»). Затем они должны использовать эту информацию, чтобы прийти к предварительному суждению о том, сколько алкогольных напитков они выпивают в обычный день. Например, это может означать деление количества алкогольных напитков, которые они выпили на прошлой неделе, на семь, чтобы получить среднее количество алкогольных напитков в день. Затем они должны отформатировать этот предварительный ответ с точки зрения фактически предоставленных вариантов ответа. В этом случае варианты создают дополнительные проблемы интерпретации. Например, что означает «средний» и что будет считаться «несколько больше» среднего? Наконец, они должны решить, хотят ли они сообщить об ответе, который они придумали, или они хотят каким-то образом отредактировать его. Например, если они считают, что пьют гораздо больше, чем в среднем, они могут не захотеть сообщать об этом, опасаясь плохо выглядеть в глазах исследователя.


С этой точки зрения то, что на первый взгляд кажется простым вопросом, как спросить людей, сколько они пьют (и получить от них прямой ответ), оказывается гораздо более сложным.


Влияние контекста на ответы анкеты

Опять же, эта сложность может привести к непреднамеренному влиянию на ответы респондентов. Их часто называют эффектами контекста, поскольку они связаны не с содержанием элемента, а с контекстом, в котором этот элемент появляется (Schwarz & Strack, 1990). Шварц, Н., и Страк, Ф. (1990). Эффекты контекста в опросах отношения: применение когнитивной теории к социальным исследованиям. В W. Stroebe & M. Hewstone (Eds.), Европейский обзор социальной психологии (том 2, стр. 31–50). Чичестер, Великобритания: Wiley. Например, есть эффект порядка предметов .когда порядок, в котором представлены предметы, влияет на реакцию людей. Один элемент может изменить то, как участники интерпретируют более поздний элемент, или изменить информацию, которую они получают, чтобы ответить на более поздние элементы. Например, исследователь Фриц Штрак и его коллеги опросили студентов колледжа об их общей удовлетворенности жизнью и частоте свиданий (Strack, Martin & Schwarz, 1988). Страк, Ф., Мартин, Л.Л., и Шварц, Н. (1988). Подготовка и общение: социальные детерминанты использования информации в суждениях об удовлетворенности жизнью. Европейский журнал социальной психологии , 18 , 429–442.Когда на первое место вышел пункт удовлетворенности жизнью, корреляция между ними составляла всего -0,12, что позволяет предположить, что эти две переменные слабо связаны. Но когда на первое место вышла частота свиданий, корреляция между ними составила +0,66, что позволяет предположить, что те, кто чаще встречается, имеют сильную тенденцию быть более удовлетворенными своей жизнью. Сообщение о частоте свиданий сначала сделало эту информацию более доступной в памяти, чтобы они с большей вероятностью основывали на ней свой рейтинг удовлетворенности жизнью.


Предоставленные варианты ответов также могут непреднамеренно влиять на ответы людей (Schwarz, 1999). Шварц, Н. (1999). Самоотчеты: как вопросы формируют ответы. Американский психолог , 54 , 93–105.Например, когда людей спрашивают, как часто они «действительно раздражаются», и дают варианты ответов от «реже, чем раз в год» до «чаще, чем раз в месяц», они, как правило, думают о серьезных раздражениях и редко сообщают о раздражении. Но когда им дают варианты ответа от «реже одного раза в день» до «несколько раз в месяц», они склонны думать о незначительных раздражениях и сообщают о частом раздражении. Люди также склонны считать, что средние варианты ответов представляют собой то, что является нормальным или типичным. Поэтому, если они считают себя нормальными или типичными, они склонны выбирать средние варианты ответов. Например, люди, скорее всего, сообщат, что смотрят телевизор больше, если варианты ответов сосредоточены на среднем варианте 4 часа, чем когда центрированы на среднем варианте 2 часа.


Составление пунктов анкеты опроса

Типы предметов

Вопросы анкеты могут быть как открытыми, так и закрытыми. Открытые элементы просто задают вопрос и позволяют участникам отвечать любым удобным для них способом. Ниже приведены примеры открытых вопросов анкеты.


«Чему важнее всего научить детей, чтобы подготовить их к жизни?»

«Пожалуйста, опишите случай, когда вы подверглись дискриминации из-за вашего возраста».

— Есть что-нибудь еще, о чем вы хотели бы нам рассказать?

Открытые вопросы полезны, когда исследователи не знают, как участники могут отреагировать, или хотят избежать влияния на их ответы. Они, как правило, используются, когда у исследователей есть более расплывчатые вопросы исследования — часто на ранних стадиях исследовательского проекта. Открытые вопросы относительно легко написать, потому что нет вариантов ответов, о которых нужно беспокоиться. Однако они требуют больше времени и усилий со стороны участников, и исследователю труднее их анализировать, поскольку ответы должны быть расшифрованы, закодированы и подвергнуты той или иной форме контент-анализа.


Закрытые элементы задают вопрос и предоставляют участникам набор вариантов ответов на выбор. Только что упомянутый алкогольный продукт является примером, как и следующие:


  


Сколько тебе лет?


_____ До 18

_____ от 18 до 34 лет

_____ от 35 до 49 лет

_____ от 50 до 70

_____ старше 70 лет

По шкале от 0 (полное отсутствие боли) до 10 (самая сильная боль из когда-либо испытанных), насколько сильно вы испытываете боль прямо сейчас?


Вы когда-нибудь в своей взрослой жизни были в депрессии в течение 2 недель или более?


Закрытые вопросы используются, когда исследователи имеют хорошее представление о различных ответах, которые могут дать участники. Они также используются, когда исследователей интересует четко определенная переменная или конструкция, например уровень согласия участников с некоторым утверждением, восприятие риска или частота определенного поведения. Закрытые вопросы написать сложнее, потому что они должны включать соответствующий набор вариантов ответов. Тем не менее, они относительно быстры и легки для участников. Их также намного легче анализировать исследователям, потому что ответы можно легко преобразовать в числа и ввести в электронную таблицу. По этим причинам закрытые элементы встречаются гораздо чаще.


Все закрытые вопросы включают набор вариантов ответов, из которых участник должен выбрать. Для категориальных переменных, таких как пол, раса или предпочтение политической партии, обычно перечисляются категории, и участники выбирают одну (или несколько), к которой они принадлежат. Для количественных переменных обычно предоставляется рейтинговая шкала. Рейтинговая шкала представляет собой упорядоченный набор ответов, из которых участники должны выбирать. Рисунок 9.2 «Примеры рейтинговых шкал для пунктов закрытого вопросника»показывает несколько примеров. Количество вариантов ответа по типичной оценочной шкале колеблется от трех до одиннадцати, хотя пять и семь, вероятно, наиболее распространены. Они могут состоять полностью из словесных меток или состоять из набора чисел со словесными метками в качестве «якорей». В некоторых случаях словесные метки или цифры могут быть дополнены (или даже заменены) осмысленной графикой. Последняя оценочная шкала, показанная на рис. 9.2 «Примеры оценочных шкал для вопросов закрытого вопросника» , представляет собой визуально-аналоговую шкалу, на которой участники делают отметку где-то вдоль горизонтальной линии, чтобы указать величину своего ответа.


Рисунок 9.2 Пример шкалы оценок для элементов закрытого вопросника



Что такое шкала Лайкерта?

Читая о психологических исследованиях, вы, вероятно, встретите термин « шкала Лайкерта» . Хотя этот термин иногда используется для обозначения почти любой оценочной шкалы (например, шкалы удовлетворенности жизнью от 0 до 10), он имеет гораздо более точное значение.


В 1930-х годах исследователь Ренсис Лайкерт (произносится как ЛИКЕРТ) разработал новый подход к измерению отношения людей (Лайкерт, 1932). Лайкерт, Р. (1932). Техника измерения отношения. Архив психологии , 140 , 1–55. Он включает в себя предоставление людям нескольких утверждений, включая как благоприятные, так и неблагоприятные утверждения, о каком-либо человеке, группе или идее. Затем респонденты выражают свое согласие или несогласие с каждым утверждением по 5-балльной шкале: Полностью согласен , Согласен , Ни согласен, ни не согласен , Не согласен , Категорически не согласен .. Каждому ответу присваиваются номера (при необходимости с обратным кодированием), а затем они суммируются по всем пунктам, чтобы получить оценку, отражающую отношение к человеку, группе или идее. Весь набор пунктов стал называться шкалой Лайкерта.


Таким образом, если вы не измеряете отношение людей к чему-либо, оценивая уровень их согласия с несколькими утверждениями об этом, лучше не называть это шкалой Лайкерта. Вероятно, вы просто используете «рейтинговую шкалу».


Написание эффективных элементов

Теперь мы можем рассмотреть некоторые принципы написания пунктов анкеты, которые сводят к минимуму непреднамеренные эффекты контекста и максимизируют надежность и достоверность ответов участников. Примерное руководство по написанию пунктов вопросника дается моделью BRUSO (Peterson, 2000). Петерсон, Р.А. (2000). Составление эффективных анкет . Тысяча дубов, Калифорния: Sage. Аббревиатура BRUSO означает «краткий», «актуальный», «недвусмысленный», «конкретный» и «объективный». Эффективные пункты анкеты должны быть краткими и по существу. Они избегают длинных, чрезмерно технических или ненужных слов. Это облегчает их понимание респондентами и ускоряет их заполнение. Эффективные вопросы анкеты также актуальнык исследовательскому вопросу. Если сексуальная ориентация респондента, его семейное положение или доход не имеют значения, то, вероятно, не следует включать в него пункты. Опять же, это ускоряет заполнение анкеты, но также позволяет не раздражать респондентов вопросами, которые они справедливо сочтут неуместными или даже «любопытными». Эффективные пункты вопросника также недвусмысленны ; их можно интерпретировать только одним способом. Частично проблема с пунктом об алкоголе, представленном ранее в этом разделе, заключается в том, что разные респонденты могут иметь разные представления о том, что представляет собой «алкогольный напиток» или «обычный день». Эффективные пункты вопросника также являются конкретными, чтобы респондентам было ясно, каков должен быть их ответ.быть о и понятно исследователям, о чем идет речь. Распространенной проблемой здесь являются предметы с закрытым концом, которые являются «двойными стволами». Они задают два концептуально разных вопроса, но допускают только один ответ. Например: «Пожалуйста, оцените степень беспокойства и депрессии». Этот пункт, вероятно, следует разделить на два отдельных пункта — один о тревоге и один о депрессии. Наконец, эффективные вопросы анкеты объективны в том смысле, что они не раскрывают собственного мнения исследователя и не заставляют участников отвечать определенным образом. В Таблице 9.2 «Модель BRUSO для написания эффективных пунктов вопросника, а также примеры» показаны некоторые примеры плохих и эффективных пунктов вопросника на основе критериев BRUSO.


Таблица 9.2 Модель BRUSO для написания эффективных пунктов вопросника, а также примеры


Критерий Бедный Эффективный

Б—Кратко — Вы сейчас или когда-нибудь владели огнестрельным оружием? — У тебя когда-нибудь было ружье?

R — актуально «Какова ваша сексуальная ориентация?» Не включайте этот пункт, если он не имеет прямого отношения к исследованию.

U — однозначный — Вы вооруженный человек? — У тебя сейчас есть оружие?

S — конкретный «Как много вы читали о новых мерах по контролю над оружием и налоге с продаж?»

«Как много вы читали о новых мерах по контролю над оружием?»


«Как много вы читали о новом налоге с продаж?»


O—Цель «Насколько вы поддерживаете новую меру контроля над оружием?» «Как вы относитесь к новым мерам контроля над оружием?»

Для закрытых вопросов также важно создать соответствующую шкалу ответов. Для категориальных переменных представленные категории, как правило, должны быть взаимоисключающими и исчерпывающими. Взаимоисключающие категории не пересекаются. Например, для предмета религии категории христиан и католиков не исключают друг друга, но протестанты и католики являются взаимоисключающими. Исчерпывающие категории охватывают все возможные ответы. Хотя протестантизм и католицизм исключают друг друга, они не являются исчерпывающими, поскольку существует множество других религиозных категорий, которые респондент может выбрать: иудеи , индуисты , буддисты ., и так далее. Во многих случаях невозможно включить все возможные категории, и в этом случае хорошим решением является категория « Другое » с местом, где респондент может указать более конкретный ответ. Если респонденты могут принадлежать более чем к одной категории (например, раса), им следует дать указание выбрать все применимые категории.


Что касается рейтинговых шкал, пять или семь вариантов ответа обычно обеспечивают максимальную точность, на которую способны респонденты. Однако иногда могут быть уместны числовые шкалы с большим количеством опций. Для таких параметров, как привлекательность, боль и вероятность, шкала от 0 до 10 будет знакома многим респондентам и им будет легко ее использовать. Независимо от количества вариантов ответа, наиболее экстремальные из них, как правило, должны быть «сбалансированы» вокруг нейтральной или модальной средней точки. Пример несбалансированной рейтинговой шкалы, измеряющей предполагаемую вероятность, может выглядеть следующим образом:


 


Маловероятно | Скорее всего | Вероятно | Очень вероятно | Очень вероятно


 


Сбалансированная версия может выглядеть так:


 


Крайне маловероятно | Несколько маловероятно | Скорее всего, нет | Скорее всего | Очень вероятно


 


Обратите внимание, однако, что средний или нейтральный вариант ответа не обязательно должен быть включен. Исследователи иногда предпочитают опускать его, потому что хотят побудить респондентов более глубоко обдумать свой ответ, а не просто выбирать средний вариант по умолчанию.


Шкалы числовых оценок часто начинаются с 1 и доходят до 5 или 7. Однако они также могут начинаться с 0, если самый низкий вариант ответа означает полное отсутствие чего-либо (например, отсутствие боли). Они также могут иметь 0 в качестве средней точки, но важно подумать о том, как это может изменить интерпретацию людьми вариантов ответа. Например, когда людей просят оценить, насколько они успешны в жизни по шкале от 0 до 10, многие люди используют числа в нижней половине шкалы, потому что они интерпретируют это как означающее, что они лишь частично добились успеха в жизни. Но когда их просят оценить, насколько они успешны в жизни по шкале от -5 до +5, очень немногие люди используют числа в нижней половине шкалы, потому что они интерпретируют это как означающее, что они на самом деле не достигли успеха в жизни (Schwarz, 1999) . ).Шварц, Н. (1999). Самоотчеты: как вопросы формируют ответы. Американский психолог , 54 , 93–105.


Форматирование анкеты

Написание эффективных пунктов — это только одна часть составления анкеты. Во-первых, каждая анкета должна иметь письменное или устное введение, выполняющее две основные функции (Peterson, 2000). Петерсон, Р.А. (2000). Составление эффективных анкет . Тысяча дубов, Калифорния: Sage.Один из них заключается в том, чтобы побудить респондентов принять участие в опросе. Во многих типах исследований в таком поощрении нет необходимости либо потому, что участники не знают, что они участвуют в исследовании (как при естественном наблюдении), либо потому, что они являются частью пула испытуемых и уже продемонстрировали свою готовность участвовать, записавшись и показав на учебу. Опросное исследование обычно застает респондентов врасплох, когда они отвечают на звонки, заходят в почтовый ящик или проверяют электронную почту, и исследователь должен убедительно обосновать, почему они должны согласиться на участие. Таким образом, введение должно кратко объяснять цель опроса и его важность, предоставлять информацию о спонсоре опроса (опросы, проводимые университетами, как правило, дают более высокий процент ответов), признавать важность участия респондента,


Вторая функция введения заключается в установлении информированного согласия. Помните, что это означает описание респондентам всего, что может повлиять на их решение об участии. Это включает в себя темы, охватываемые опросом, количество времени, которое он может занять, возможность респондента отказаться от участия в любое время, вопросы конфиденциальности и т. д. Письменные формы согласия обычно не используются в опросных исследованиях, поэтому важно, чтобы эта часть введения была хорошо задокументирована и четко и полностью представлена ​​каждому респонденту.


За введением должны следовать основные пункты вопросника. Но сначала важно представить четкие инструкции по заполнению анкеты, включая примеры того, как использовать любые необычные шкалы ответов. Помните, что именно в этот момент респонденты обычно проявляют наибольший интерес и меньше всего утомляются, поэтому рекомендуется начинать с наиболее важных элементов для целей исследования и переходить к менее важным элементам. Элементы также должны быть сгруппированы по темам или по типу. Например, пункты, использующие одну и ту же оценочную шкалу (например, 5-балльную шкалу согласия), должны быть сгруппированы вместе, если это возможно, чтобы упростить и ускорить работу респондентов. Демографические вопросы часто представляются последними, потому что они наименее интересны участникам, но к ним легко ответить, если респонденты устали или им стало скучно. Конечно,


КЛЮЧЕВЫЕ ВЫВОДЫ

Ответ на элемент опроса сам по себе является сложным когнитивным процессом, который включает в себя интерпретацию вопроса, получение информации, вынесение предварительного суждения, перевод этого суждения в требуемый формат ответа и редактирование ответа.

Ответы на анкеты опроса подвержены многочисленным контекстным эффектам из-за формулировок вопросов, порядка пунктов, вариантов ответа и других факторов. Исследователи должны учитывать такие эффекты при построении опросов и интерпретации результатов опросов.

Пункты анкеты обследования бывают открытыми или закрытыми. Открытые элементы просто задают вопрос и позволяют респондентам отвечать так, как они хотят. В закрытых заданиях задается вопрос и предлагается несколько вариантов ответов, из которых респонденты должны выбрать один из них.

Согласно модели BRUSO, вопросы анкеты должны быть краткими, релевантными, недвусмысленными, конкретными и объективными.

УПРАЖНЕНИЯ

Обсуждение: напишите элемент опроса, а затем напишите краткое описание того, как кто-то может отреагировать на этот элемент на основе когнитивной модели ответа на опрос (или выберите любой элемент шкалы самооценки Розенберга на http://www.bsos.umd). .edu/socy/research/rosenberg.htm ).

Практика: Напишите пункты анкеты для каждого из следующих общих вопросов. В некоторых случаях может потребоваться ряд элементов, а не один элемент.


Как часто респондент использует Facebook?

Сколько упражнений делает респондент?

Насколько вероятно, по мнению респондента, что действующий президент будет переизбран на следующих президентских выборах?

В какой степени респондент испытывает «дорожную ярость»?

9.3 Проведение опросов

ЦЕЛИ ОБУЧЕНИЯ

Объясните разницу между вероятностной и невероятностной выборкой и опишите основные типы вероятностной выборки.

Дайте определение систематической ошибке выборки в целом и систематической ошибке неполучения ответов в частности. Перечислите некоторые приемы, которые можно использовать для увеличения количества ответов и уменьшения систематической ошибки, связанной с неответами.

Перечислите четыре основных способа проведения опроса, а также плюсы и минусы каждого из них.

В этом разделе мы рассмотрим, как проводить опрос. Сначала мы рассмотрим вопрос о выборке, а затем рассмотрим некоторые другие методы фактического сбора данных обследования.


Выборка

По сути, все психологические исследования включают в себя выборку — выборку для изучения из интересующей совокупности. Выборка делится на две широкие категории. Вероятностная выборка имеет место, когда исследователь может указать вероятность того, что каждый член совокупности будет отобран для выборки. Невероятностная выборка возникает, когда исследователь не может указать эти вероятности. В большинстве психологических исследований используется невероятностная выборка. Удобная выборка — изучение лиц, оказавшихся поблизости и желающих участвовать, — очень распространенная форма невероятностной выборки, используемая в психологических исследованиях.


Исследователи опросов, однако, гораздо чаще используют какую-либо форму вероятностной выборки. Это связано с тем, что цель большинства опросных исследований состоит в том, чтобы сделать точные оценки того, что верно для конкретной группы населения, и эти оценки наиболее точны, когда они основаны на вероятностной выборке. Например, для исследователей, проводящих опросы, важно основывать свои оценки результатов выборов, которые часто определяются лишь несколькими процентными пунктами, на вероятностных выборках вероятных зарегистрированных избирателей.


По сравнению с невероятностной выборкой вероятностная выборка требует очень четкого определения генеральной совокупности, что, конечно же, зависит от вопросов исследования, на которые необходимо ответить. Население может состоять из всех зарегистрированных избирателей в штате Арканзас, всех американских потребителей, купивших автомобиль в прошлом году, женщин в Соединенных Штатах старше 40 лет, которым сделали маммографию в последнее десятилетие, или всех выпускников конкретного университета. После определения генеральной совокупности вероятностная выборка требует основы выборки .. По сути, это список всех членов совокупности, из которых можно выбрать респондентов. Основы выборки могут поступать из различных источников, включая телефонные справочники, списки зарегистрированных избирателей, больничные или страховые записи. В некоторых случаях карта может служить в качестве основы выборки, позволяя выбирать города, улицы или домохозяйства.


Существует множество различных методов вероятностной выборки. Простая случайная выборка делается таким образом, чтобы каждый человек в популяции имел равную вероятность быть отобранным для выборки. Это может включать в себя помещение имен всех лиц в основу выборки в шляпу, их перемешивание, а затем вытягивание числа, необходимого для выборки. Учитывая, что большинство основ выборки имеют форму компьютерных файлов, случайная выборка, скорее всего, будет включать компьютеризированную сортировку или отбор респондентов. Распространенным подходом в телефонных опросах является набор случайных цифр, при котором компьютер случайным образом генерирует телефонные номера из числа возможных телефонных номеров в данной географической области.


Распространенной альтернативой простой случайной выборке является стратифицированная случайная выборка ., в котором население делится на разные подгруппы или «страты» (обычно на основе демографических характеристик), а затем из каждой «страты» берется случайная выборка. Стратифицированную случайную выборку можно использовать для формирования выборки, в которой доля респондентов в каждой из различных подгрупп соответствует доле в генеральной совокупности. Например, поскольку около 12,5% населения США составляют чернокожие, можно использовать стратифицированную случайную выборку, чтобы гарантировать, что опрос 1000 взрослых американцев включает около 125 чернокожих респондентов. Стратифицированная случайная выборка также может использоваться для выборки дополнительных респондентов из особенно небольших подгрупп, что позволяет сделать обоснованные выводы об этих подгруппах. Например, поскольку американцы азиатского происхождения составляют довольно небольшой процент населения США (около 4,5%), простая случайная выборка из 1, 000 взрослых американцев могут включать в себя слишком мало американцев азиатского происхождения, чтобы делать какие-либо выводы о них в отличие от любой другой подгруппы. Однако, если это важно для вопроса исследования, то можно использовать стратифицированную случайную выборку, чтобы гарантировать, что в выборку включено достаточное количество респондентов из числа американцев азиатского происхождения, чтобы сделать достоверные выводы об американцах азиатского происхождения в целом.


Еще одним типом вероятностной выборки является кластерная выборка , при которой случайным образом отбираются более крупные группы людей, а затем случайным образом отбираются люди внутри каждой группы. Например, чтобы выбрать выборку жителей маленького городка в Соединенных Штатах, исследователь может случайным образом выбрать несколько небольших городов, а затем случайным образом выбрать несколько человек в каждом городе. Кластерная выборка особенно полезна для обследований, включающих личные опросы, поскольку она сводит к минимуму количество поездок, которые приходится совершать интервьюерам. Например, вместо поездки в 200 малых городов для опроса 200 жителей исследовательская группа могла бы посетить 10 малых городов и опросить по 20 жителей в каждом. Национальное обследование коморбидности проводилось с использованием кластерной выборки.


Насколько большой должна быть выборка обследования? В общем, это зависит от двух факторов. Одним из них является уровень уверенности в результате, которого хочет исследователь. Чем больше выборка, тем ближе любая статистика, основанная на этой выборке, будет иметь тенденцию быть к соответствующему значению в совокупности. Другим фактором является бюджет исследования. Выборки большего размера обеспечивают большую достоверность, но для их получения требуется больше времени, усилий и денег. Принимая во внимание эти два фактора, в большинстве исследований используются выборки размером от 100 до 1000 человек.


Размер выборки и численность населения

Почему выборка в 1000 человек считается достаточной для большинства исследований, даже если население намного больше? Учтите, например, что выборка всего из 1000 зарегистрированных избирателей обычно считается хорошей выборкой из примерно 120 миллионов зарегистрированных избирателей населения США, даже если она включает лишь около 0,0008% населения! Ответ немного удивителен.


Одна часть ответа заключается в том, что статистика, основанная на большей выборке, будет иметь тенденцию быть ближе к значению генеральной совокупности, и это можно охарактеризовать математически. Представьте, например, что в выборке зарегистрированных избирателей ровно 50% говорят, что намерены голосовать за действующего президента. Если в этой выборке 100 избирателей, то с вероятностью 95% истинный процент населения находится между 40 и 60. Но если в выборке 1000 избирателей, то с вероятностью 95% истинный процент в популяции составляет от 47 до 53. Хотя этот «95% доверительный интервал» продолжает сокращаться по мере увеличения размера выборки, это происходит медленнее. Например, если в выборке 2000 избирателей, то это только уменьшает 95% доверительный интервал до 48–52. Во многих ситуациях


Другая часть ответа — и, возможно, более удивительная часть — заключается в том, что доверительные интервалы зависят только от размера выборки, а не от размера совокупности. Таким образом, выборка из 1000 человек дает 95% доверительный интервал от 47 до 53 независимо от того, составляет ли численность населения сто тысяч, миллион или сто миллионов человек.


Смещение выборки

Вероятностная выборка была разработана в значительной степени для решения проблемы систематической ошибки выборки. Систематическая ошибка выборки возникает, когда выборка выбрана таким образом, что она не является репрезентативной для всей совокупности и, следовательно, дает неточные результаты. Это было причиной того, что соломенный опрос « Литературного дайджеста » был так далек от предсказания президентских выборов 1936 года. Используемые списки рассылки в основном были взяты из телефонных справочников и списков зарегистрированных владельцев автомобилей, в которых преобладали более богатые люди, которые с большей вероятностью проголосовали за Лэндона. Гэллап добился успеха, потому что знал об этом предубеждении и нашел способы опросить и менее богатых людей.


Существует одна форма систематической ошибки выборки, которой подвержена даже тщательная случайная выборка. Практически никогда не бывает так, чтобы все, отобранные для выборки, действительно отвечали на вопросы опроса. Некоторые, возможно, умерли или уехали, а другие могут отказаться от участия, потому что они слишком заняты, не интересуются темой опроса или не участвуют в опросах из принципа. Если эти лица, не ответившие на опрос, систематически отличаются от респондентов, то это может привести к систематической ошибке , связанной с отсутствием ответов . Например, в почтовом опросе об употреблении алкоголя исследователь Вивьен Лахаут и его коллеги обнаружили, что только половина выборки ответила после первоначального контакта и двух последующих напоминаний (Lahaut, Jansen, van de Mheen, & Garretsen, 2002).Lahaut, VMHCJ, Jansen, HAM, van de Mheen, D., & Garretsen, HFL (2002). Систематическая ошибка отсутствия ответов в выборочном обследовании потребления алкоголя. Алкоголь и алкоголизм , 37 , 256–260.Опасность здесь заключается в том, что у половины ответивших могут быть иные модели потребления алкоголя, чем у половины, которые не ответили, что может привести к неточным выводам со стороны исследователей. Поэтому, чтобы проверить систематическую ошибку, связанную с неответом, исследователи позже без предупреждения посетили дома подмножества не ответивших, возвращаясь до пяти раз, если они не заставали их дома. Они обнаружили, что среди первоначальных неответчиков была особенно высокая доля трезвенников (непьющих), а это означало, что их оценки потребления алкоголя, основанные только на первоначальных респондентах, были слишком высокими.


Хотя существуют методы статистической коррекции систематической ошибки, связанной с отсутствием ответов, они основаны на предположениях о не ответивших, например, на то, что они больше похожи на поздно ответивших, чем на ранних ответивших, что может быть неверным. По этой причине лучший подход к минимизации систематической ошибки, связанной с неответами, состоит в том, чтобы свести к минимуму количество неответивших, то есть максимально увеличить процент ответивших. Существует обширная исследовательская литература о факторах, влияющих на процент ответов на опросы (Groves et al., 2004). Гровс, Р.М., Фаулер, Ф.Дж., Купер, М.П., ​​Лепковски, Дж.М., Сингер, Э., и Туранжо, Р. (2004). Методология обследования . Хобокен, Нью-Джерси: Wiley.В целом, личные интервью имеют самые высокие показатели ответов, за ними следуют телефонные опросы, а затем опросы по почте и через Интернет. Среди других факторов, повышающих уровень ответов, — отправка потенциальным респондентам короткого предварительного уведомления, информирующего их о том, что им будет предложено принять участие в опросе в ближайшем будущем, и отправка простых дополнительных напоминаний не ответившим через несколько недель. Воспринимаемая длина и сложность опроса также имеют значение, поэтому важно, чтобы вопросники опроса были как можно короче, проще и по теме. Наконец, поощрение, особенно наличными, — это надежный способ увеличить количество откликов.


Проведение опроса

Существует четыре основных способа проведения опросов: личное собеседование, по телефону, по почте и через Интернет. Как и в случае с другими аспектами дизайна опроса, выбор зависит как от целей исследователя, так и от бюджета. Очные интервью имеют самый высокий процент ответов и обеспечивают самый тесный личный контакт с респондентами. Личный контакт может быть важен, например, когда интервьюер должен видеть респондентов и делать суждения о них, как в случае некоторых интервью по психическому здоровью. Но личное собеседование, безусловно, является самым дорогостоящим подходом. Телефонные опросы имеют более низкий уровень ответов и все же обеспечивают некоторый личный контакт с респондентами. Они также могут быть дорогостоящими, но, как правило, дешевле, чем личные интервью. Традиционно телефонные справочники обеспечивали довольно обширные основы выборки.


Неудивительно, что интернет-опросы становятся все более распространенными. Их становится все проще создавать и использовать (см. «Создание онлайн-опросов»). Хотя первоначальный контакт можно установить по почте, предоставив ссылку на опрос, этот подход не обязательно дает более высокий процент ответов, чем обычный опрос по почте. Лучшим подходом является установление первоначального контакта по электронной почте с прямой ссылкой на опрос. Это может хорошо работать, когда население состоит из членов организации, которые знают адреса электронной почты и регулярно их используют (например, университетское сообщество). Для других групп населения может быть трудно или невозможно найти полный список адресов электронной почты, который мог бы служить основой для выборки. В качестве альтернативы запрос на участие в опросе со ссылкой на него может быть размещен на веб-сайтах, о которых известно, что их посещают представители населения. Но опять же, таким образом очень сложно получить что-либо близкое к случайной выборке, потому что члены населения, посещающие веб-сайты, скорее всего, будут отличаться от населения в целом. Однако методы интернет-опросов быстро развиваются. Из-за их низкой стоимости и того, что больше людей находится в сети, чем когда-либо прежде, Интернет-опросы, вероятно, станут доминирующим подходом к сбору данных для обследований в ближайшем будущем.


Создание онлайн-опроса

В настоящее время существует несколько онлайн-инструментов для создания онлайн-анкет. После создания анкеты ссылку на нее можно отправить по электронной почте потенциальным респондентам или встроить в веб-страницу. Следующие веб-сайты входят в число тех, которые предлагают бесплатные учетные записи. Хотя бесплатные учетные записи ограничивают количество пунктов вопросника и количество респондентов, они могут быть полезны для проведения небольших опросов и для применения принципов правильного построения вопросника.


Полдэдди — http://www.polldaddy.com

ВопросПро — http://www.questionpro.com

SurveyGizmo — http://www.surveygizmo.com

SurveyMonkey — http://www.surveymonkey.com

Зумеранг — http://www.zoomerang.com

КЛЮЧЕВЫЕ ВЫВОДЫ

Опросное исследование обычно включает вероятностную выборку, при которой каждый член совокупности имеет известную вероятность быть отобранным для выборки. Типы вероятностной выборки включают простую случайную выборку, стратифицированную случайную выборку и кластерную выборку.

Систематическая ошибка выборки возникает, когда выборка выбрана таким образом, что она не является репрезентативной для генеральной совокупности и, следовательно, дает неточные результаты. Наиболее распространенной формой систематической ошибки выборки является систематическая ошибка, связанная с отсутствием ответов, которая возникает, когда люди, которые не отвечают на опрос, существенно отличаются от людей, которые отвечают. Лучший способ свести к минимуму систематическую ошибку, связанную с отсутствием ответов, — максимизировать долю ответов, заранее уведомляя респондентов, отправляя им напоминания, создавая короткие и простые для заполнения анкеты и предлагая поощрения.

Опросы могут проводиться лично, по телефону, по почте и через Интернет. Личное интервью имеет самый высокий процент ответов, но является самым дорогим. Почтовые и интернет-опросы менее затратны, но дают гораздо меньше ответов. Интернет-опросы, вероятно, станут доминирующим подходом из-за их низкой стоимости.

УПРАЖНЕНИЯ

Обсуждение: Если возможно, определите соответствующую основу выборки для каждой из следующих совокупностей. Если нет подходящей основы выборки, объясните, почему.


студенты определенного колледжа или университета

взрослые, живущие в штате Невада

домохозяйства в Литл-Роке, Арканзас

люди с низкой самооценкой

Практика: используйте один из инструментов для создания онлайн-опросов, чтобы создать анкету из 10 пунктов по выбранной вами теме.



Однотематическое исследование

Исследователь Вэнс Холл и его коллеги столкнулись с проблемой увеличения степени, в которой шесть учеников начальной школы, склонных к подрыву общественного порядка, оставались сосредоточенными на своих школьных занятиях (Hall, Lund & Jackson, 1968). Холл Р.В., Лунд Д. и Джексон Д. (1968). Влияние внимания учителя на поведение в учебе. Журнал прикладного анализа поведения , 1 , 1–12.В течение каждого из нескольких дней исследователи тщательно фиксировали, выполнял ли каждый ученик школьные задания каждые 10 секунд в течение 30-минутного периода. Как только они установили этот базовый уровень, они ввели лечение. Обращение заключалось в том, что, когда ученик делал домашнее задание, учитель оказывал ему или ей положительное внимание в виде комментария, такого как «хорошая работа», или похлопывания по плечу. В результате все учащиеся резко увеличили время, затрачиваемое на школьные занятия, и уменьшили свое деструктивное поведение на этом этапе лечения. Например, ученик по имени Робби изначально тратил 25 % своего времени на школьные занятия, а остальные 75 % «щелкал резинками, играл с игрушками из кармана, разговаривал и смеялся со сверстниками» (стр. 3). Однако на этапе лечения он тратил 71% своего времени на школьные занятия и только 29% на другие занятия. Наконец, когда исследователи заставили учителя перестать уделять ему позитивное внимание, все ученики уменьшили свою учебу и увеличили свое разрушительное поведение. Это подтвердило, что на самом деле именно положительное внимание способствовало повышению успеваемости. Это было одно из первых исследований, показавших, что внимание к позитивному поведению и игнорирование негативного поведения может быть быстрым и эффективным способом справиться с проблемным поведением в прикладной среде.


Большая часть этой книги посвящена тому, что можно назвать групповым исследованием, которое обычно включает изучение большого числа участников и объединение их данных для получения общих выводов о человеческом поведении. Исследование Холла и его коллег, напротив, является примером исследования одного субъекта, которое обычно включает изучение небольшого числа участников и пристальное внимание к каждому человеку. В этой главе мы рассмотрим этот альтернативный подход. Мы начнем с обзора исследования одного субъекта, включая некоторые предположения, на которых оно основано, кто его проводит и почему они это делают. Затем мы рассмотрим некоторые основные планы исследований с одним предметом и то, как анализируются данные этих планов. Окончательно,


10.1 Обзор исследования одного субъекта

ЦЕЛИ ОБУЧЕНИЯ

Объясните, что такое исследование с одним предметом, в том числе чем оно отличается от других видов психологических исследований.

Объясните, что такое тематические исследования, включая их сильные и слабые стороны.

Объясните, кто использует исследования с одним предметом и почему.

Что такое исследование одного субъекта?

Односубъектное исследование — это вид количественного исследования, предполагающего детальное изучение поведения каждого из небольшого числа участников. Обратите внимание, что термин « один субъект » не означает, что изучается только один участник; обычно бывает от двух до десяти участников. (Вот почему планы исследований с одним испытуемым иногда называют планами с малым n , где n — статистический символ размера выборки.) Исследование с одним испытуемым можно противопоставить групповому исследованию ., который обычно включает изучение большого числа участников и изучение их поведения в первую очередь с точки зрения групповых средних значений, стандартных отклонений и т. д. Большая часть этой книги посвящена изучению группового исследования, которое является наиболее распространенным подходом в психологии. Но исследование одного субъекта является важной альтернативой и основным подходом в некоторых областях психологии.


Прежде чем продолжить, важно отличить исследование одного субъекта от двух других подходов, каждый из которых предполагает подробное изучение небольшого числа участников. Одним из них является качественное исследование, которое сосредоточено на понимании субъективного опыта людей путем сбора относительно неструктурированных данных (например, подробных интервью) и анализа этих данных с использованием описательных, а не количественных методов. Исследования с одним субъектом, напротив, сосредоточены на понимании объективного поведения посредством экспериментальных манипуляций и контроля, сборе строго структурированных данных и количественном анализе этих данных.


Также важно отличать исследования одного субъекта от тематических исследований. Тематическое исследование представляет собой подробное описание человека, которое может включать как качественный, так и количественный анализ. (Тематические исследования, которые включают только качественный анализ, могут считаться типом качественного исследования.) История психологии полна влиятельных тематических исследований, таких как описание Зигмундом Фрейдом «Анны О.». (см. примечание 10.5 «Дело «Анны О.» ) и описание Джона Уотсона и Розали Рейнер Маленького Альберта (Watson & Rayner, 1920), Watson, JB, & Rayner, R. (1920). Условные эмоциональные реакции. Журнал экспериментальной психологии , 3 , 1–14.который научился бояться белой крысы — наряду с другими пушистыми объектами — когда исследователи издали громкий звук, пока он играл с крысой. Тематические исследования могут быть полезны для предложения новых исследовательских вопросов и для иллюстрации общих принципов. Они также могут помочь исследователям понять редкие явления, такие как последствия повреждения определенной части человеческого мозга. Однако, как правило, тематические исследования не могут заменить тщательно спланированные групповые исследования или исследования с участием одного субъекта. Одна из причин заключается в том, что тематические исследования обычно не позволяют исследователям определить, связаны ли конкретные события причинно-следственной связью или вообще связаны. Например, если пациент описан в тематическом исследовании как жертва сексуального насилия в детстве, а затем как у него развилось расстройство пищевого поведения в подростковом возрасте, нет никакого способа определить, имели ли эти два события какое-либо отношение друг к другу. Вторая причина заключается в том, что отдельный случай всегда может быть каким-то образом необычным и, следовательно, нерепрезентативным для людей в целом. Таким образом, тематические исследования имеют серьезные проблемы как с внутренней, так и с внешней валидностью.


Дело «Анны О.»

Зигмунд Фрейд использовал случай с молодой женщиной, которую он назвал «Анна О.». чтобы проиллюстрировать многие принципы его теории психоанализа (Фрейд, 1961). Фрейд, С. (1961). Пять лекций по психоанализу . Нью-Йорк, штат Нью-Йорк: Нортон. (Ее настоящее имя было Берта Паппенгейм, и она была одной из первых феминисток, внесших важный вклад в область социальной работы.) Анна обратилась к коллеге Фрейда Йозефу Брейеру примерно в 1880 году с различными странными физическими и психологическими симптомами. Одна из них заключалась в том, что в течение нескольких недель она не могла пить никаких жидкостей. Согласно Фрейду,


Она брала вожделенный стакан воды, но как только он касался губ, отталкивала его, как человек, страдающий водобоязнью... Она питалась только фруктами, такими как дыни и т. д., чтобы уменьшить ее мучительная жажда (с. 9).


Но, по словам Фрейда, прорыв произошел однажды, когда Анна находилась под гипнозом.


[S] он ворчал на свою английскую «компаньонку», которую она не любила, и продолжал описывать со всеми признаками отвращения, как она однажды вошла в комнату этой дамы и как ее маленькая собачка - ужасное создание !— выпил там из стакана. Пациентка ничего не сказала, так как хотела быть вежливой. Дав еще более энергичное выражение гневу, который она сдерживала, она попросила чего-нибудь попить, без труда выпила большое количество воды и очнулась от гипноза со стаканом у губ; и после этого волнение исчезло, чтобы никогда не вернуться.


Интерпретация Фрейда заключалась в том, что Анна подавила воспоминание об этом инциденте вместе с вызванной им эмоцией, и именно это стало причиной ее неспособности пить. Кроме того, ее воспоминание об инциденте, наряду с выражением эмоции, которую она подавляла, вызвали исчезновение симптома.


В качестве иллюстрации теории Фрейда весьма эффектным является случай с Анной О.. Однако в качестве доказательства теории он по существу бесполезен. Описание не дает возможности узнать, действительно ли Анна вытеснила воспоминание о собаке, пьющей из стакана, было ли это вытеснение причиной ее неспособности пить или воспоминание об этой «травме» облегчило симптом. Из этого тематического исследования также неясно, насколько типичным или нетипичным был опыт Анны.


Рисунок 10.2


«Анна О.» был предметом знаменитого тематического исследования, использованного Фрейдом для иллюстрации принципов психоанализа.


Источник: http://en.wikipedia.org/wiki/File:Pappenheim_1882.jpg


Предположения об исследовании одного субъекта

Опять же, исследование с одним субъектом предполагает изучение небольшого числа участников и интенсивное внимание к поведению каждого из них. Но зачем использовать этот подход вместо группового? Есть несколько важных предположений, лежащих в основе исследования одного субъекта, и будет полезно рассмотреть их сейчас.


Прежде всего, это предположение о том, что важно интенсивно сосредоточиться на поведении отдельных участников. Одна из причин этого заключается в том, что групповые исследования могут скрывать индивидуальные различия и давать результаты, которые не отражают поведение какого-либо человека. Например, лечение, оказывающее положительное влияние на половину людей, подвергшихся ему, но оказывающее отрицательное воздействие на другую половину, в среднем не имеет никакого эффекта. Однако исследование с одним субъектом, скорее всего, выявит эти индивидуальные различия. Вторая причина пристального внимания к отдельным лицам заключается в том, что иногда в первую очередь интересует поведение конкретного человека. Школьный психолог, например, может быть заинтересован в изменении поведения конкретного учащегося, который ведет себя агрессивно.


Второе допущение исследования с одним субъектом состоит в том, что важно обнаружить причинно-следственные связи посредством манипулирования независимой переменной, тщательного измерения зависимой переменной и контроля посторонних переменных. По этой причине исследование одного субъекта часто считается типом экспериментального исследования с хорошей внутренней валидностью. Вспомните, например, что Холл и его коллеги много раз измеряли свою зависимую переменную (обучение) — сначала в контрольных условиях без лечения, затем в условиях лечения (положительное внимание учителя), а затем снова в контрольных условиях. Поскольку наблюдалось явное увеличение количества исследований, когда лечение вводили, снижение, когда его отменяли, и увеличение, когда его снова вводили, мало сомнений в том, что лечение было причиной улучшения.


Третье допущение исследования с одним субъектом состоит в том, что важно изучать сильные и последовательные эффекты, имеющие биологическую или социальную значимость. Прикладные исследователи, в частности, заинтересованы в методах лечения, которые оказывают существенное влияние на важное поведение и могут быть надежно реализованы в реальных условиях, в которых они происходят. Иногда это называют социальной валидностью (Wolf, 1976). Вольф, М. (1976). Социальная валидность: случай субъективного измерения или то, как прикладной анализ поведения находит свое сердце. Журнал прикладного анализа поведения, 11 , 203–214.Исследование Холла и его коллег, например, имело хорошую социальную валидность, потому что оно показало сильное и последовательное влияние положительного внимания учителя на поведение, которое имеет очевидную важность для учителей, родителей и учеников. Кроме того, учителя обнаружили, что лечение легко осуществить даже в их часто хаотичных классах начальной школы.


Кто использует исследования одного субъекта?

Односубъектные исследования существуют столько же, сколько и сама область психологии. В конце 1800-х годов один из основателей психологии Вильгельм Вундт изучал ощущения и сознание, уделяя особое внимание каждому из небольшого числа участников исследования. Другими ранними примерами являются исследования памяти Германа Эббингауза и исследования классической обусловленности Ивана Павлова, которые до сих пор описываются почти в каждом вводном учебнике по психологии.


В середине 20-го века Б. Ф. Скиннер прояснил многие предположения, лежащие в основе исследования одного субъекта, и усовершенствовал многие из его методов (Skinner, 1938). Скиннер, Б. Ф. (1938). Поведение организмов: экспериментальный анализ . Нью-Йорк, штат Нью-Йорк: Appleton-Century-Crofts. Затем он и другие исследователи использовали его для описания того, как награды, наказания и другие внешние факторы влияют на поведение с течением времени. Эта работа проводилась в основном с использованием нечеловеческих субъектов — в основном крыс и голубей. Этот подход, который Скиннер назвал экспериментальным анализом поведения , остается важной областью психологии и продолжает полагаться почти исключительно на исследования одного субъекта. Прекрасные примеры этой работы можно найти в любом выпуске журнала.Журнал экспериментального анализа поведения . К 1960-м годам многие исследователи были заинтересованы в использовании этого подхода для проведения прикладных исследований в первую очередь с людьми — подобласть, которая теперь называется прикладным анализом поведения (Baer, ​​Wolf, & Risley, 1968). Баер, Д.М., Вольф, М.М., и Рисли, Т.Р. (1968). Некоторые современные аспекты прикладного анализа поведения. Журнал прикладного анализа поведения , 1 , 91–97. Прикладной анализ поведения играет особенно важную роль в современных исследованиях нарушений развития, образования, организационного поведения и здоровья, среди многих других областей. Прекрасные примеры этой работы (включая исследование Холла и его коллег) можно найти вЖурнал прикладного анализа поведения .


Хотя большинство современных исследований с участием одного субъекта проводится с поведенческой точки зрения, в принципе их можно использовать для решения вопросов, сформулированных с точки зрения любой теоретической точки зрения. Например, методику обучения, основанную на когнитивных принципах обучения и памяти, можно оценить, апробировав ее на отдельных старшеклассниках с использованием однопредметного подхода. Односубъектный подход также может использоваться клиницистами, придерживающимися любой теоретической точки зрения — поведенческой, когнитивной, психодинамической или гуманистической — для изучения процессов терапевтических изменений у отдельных клиентов и документирования улучшения их клиентов (Каздин, 1982). Каздин, А.Е. (1982). Индивидуальные дизайны исследований: методы для клинических и прикладных условий . Нью-Йорк, штат Нью-Йорк: Издательство Оксфордского университета.


КЛЮЧЕВЫЕ ВЫВОДЫ

Исследование одного субъекта, которое включает в себя тестирование небольшого числа участников и интенсивное внимание к поведению каждого человека, является важной альтернативой групповым исследованиям в психологии.

Односубъектные исследования следует отличать от тематических исследований, в которых подробно описывается отдельный случай. Тематические исследования могут быть полезны для постановки новых исследовательских вопросов, для изучения редких явлений и для иллюстрации общих принципов. Однако они не могут заменить тщательно контролируемые экспериментальные или корреляционные исследования, поскольку их внутренняя и внешняя валидность низка.

Односубъектные исследования существуют с самого начала психологии. Сегодня он наиболее тесно связан с теоретической поведенческой точки зрения, но в принципе может использоваться для изучения поведения с любой точки зрения.

УПРАЖНЕНИЯ

Практика: найдите и прочитайте опубликованную статью по психологии, в которой сообщается о новом исследовании с одним предметом. (Хороший источник статей, опубликованных в Journal of Applied Behavior Analysis , можно найти по адресу http://seab.envmed.rochester.edu/jaba/jabaMostPop-2011.html .) Напишите краткое изложение исследования.

Практика: найдите и прочитайте опубликованное тематическое исследование по психологии. (Используйте тематическое исследование в качестве ключевого термина в поиске PsycINFO.) Затем сделайте следующее:


Опишите одну проблему, связанную с внутренней валидностью.

Опишите одну проблему, связанную с внешней валидностью.

Сформулируйте одну гипотезу, предложенную в тематическом исследовании, которую было бы интересно проверить в систематическом исследовании с одним испытуемым или в группе.

10.2 Планы исследований с одним предметом

ЦЕЛИ ОБУЧЕНИЯ

Опишите основные элементы дизайна однотемного исследования.

Создавайте простые исследования с одним предметом, используя реверсивные и множественные базовые планы.

Объясните, как исследования с одним предметом решают проблему внутренней валидности.

Интерпретировать результаты простых исследований одного субъекта на основе визуального просмотра графических данных.

Общие черты однопредметных планов

Прежде чем рассматривать какой-либо конкретный план исследования, посвященный одному предмету, будет полезно рассмотреть некоторые черты, общие для большинства из них. Многие из этих особенностей проиллюстрированы на рис. 10.3 «Результаты общего исследования с одним предметом, иллюстрирующие несколько принципов исследования с одним предметом» , на котором показаны результаты общего исследования с одним предметом. Во-первых, зависимая переменная (представленная на оси y графика) многократно измеряется во времени (представленная на оси x ) через равные промежутки времени. Во-вторых, исследование разделено на отдельные фазы, и участник тестируется при одном условии на каждой фазе. Условия часто обозначаются заглавными буквами: A, B, C и так далее. Таким образомНа рис. 10.3 «Результаты общего исследования с одним испытуемым, иллюстрирующие несколько принципов исследования с одним испытуемым» представлена ​​схема, в которой участника сначала тестировали в одном состоянии (А), затем тестировали в другом состоянии (В) и, наконец, повторно тестировали в исходное состояние (А). (Это называется разворотным планом, и вскоре он будет обсуждаться более подробно.)


Рисунок 10.3 . Результаты типового исследования с участием одного субъекта, иллюстрирующие несколько принципов исследования с участием одного субъекта



Еще один важный аспект исследований с одним субъектом заключается в том, что переход от одного состояния к другому обычно не происходит после фиксированного количества времени или количества наблюдений. Наоборот, это зависит от поведения участника. В частности, исследователь ждет, пока поведение участника в одном состоянии не станет достаточно последовательным от наблюдения к наблюдению, прежде чем изменить условия. Это иногда называют стратегией устойчивого состояния (Sidman, 1960). Сидман, М. (1960). Тактика научного исследования: Оценка экспериментальных данных в психологии . Бостон, Массачусетс: Авторский кооператив.Идея состоит в том, что когда зависимая переменная достигает устойчивого состояния, любое изменение условий будет относительно легко обнаружить. Вспомним, что мы столкнулись с этим же принципом при более общем обсуждении экспериментальных исследований. Влияние независимой переменной легче обнаружить, когда «шум» в данных сведен к минимуму.


Разворотные конструкции

Самый простой план исследования с одним предметом - это обратный дизайн , также называемый планом ABA . На первом этапе А исходный уровеньустанавливается для зависимой переменной. Это уровень реагирования до введения какого-либо лечения, и поэтому исходная фаза является своего рода контрольным состоянием. Когда достигается устойчивый ответ, начинается фаза B, когда исследователь вводит лечение. Может быть период адаптации к лечению, в течение которого интересующее поведение становится более изменчивым и начинает увеличиваться или уменьшаться. Опять же, исследователь ждет, пока эта зависимая переменная не достигнет устойчивого состояния, чтобы было ясно, изменилась ли она и насколько. Наконец, исследователь отменяет обработку и снова ждет, пока зависимая переменная не достигнет устойчивого состояния. Этот базовый реверсивный план также может быть расширен повторным введением лечения (ABAB), еще одним возвратом к исходному уровню (ABABA) и так далее.


Исследование Холла и его коллег представляло собой реверсивную схему ABAB. На рис. 10.4 «Аппроксимация результатов Холла и его коллег Робби, участвовавших в их реверсивном проекте ABAB» , аппроксимированы данные для Робби. Процент времени, которое он потратил на учебу (зависимая переменная), был низким в течение первой базовой фазы, увеличивался во время первой фазы лечения, пока не стабилизировался, уменьшался во время второй базовой фазы и снова увеличивался во время второй фазы лечения.


Рис. 10.4 . Аппроксимация результатов Холла и его коллег Робби в их реверсивном плане ABAB



Почему обращение — удаление лечения — считается необходимым в этом типе дизайна? Зачем использовать, например, дизайн ABA, а не более простой дизайн AB? Обратите внимание, что план AB представляет собой прерванный план временного ряда, примененный к отдельному участнику. Напомним, что одна из проблем с этим планом заключается в том, что если зависимая переменная изменяется после введения обработки, не всегда ясно, что обработка была ответственна за изменение. Возможно, что-то еще изменилось примерно в то же время и что эта посторонняя переменная ответственна за изменение зависимой переменной. Но если зависимая переменная изменяется при введении лечения, а затем изменяется обратнос отменой лечения становится намного яснее, что лечение (и отмена лечения) является причиной. Другими словами, реверсирование значительно увеличивает внутреннюю валидность исследования.


Есть близкие родственники основного реверсивного дизайна, которые позволяют оценить более одного лечения. В реверсивном дизайне с несколькими видами лечения за базовой фазой следуют отдельные фазы, в которых вводятся различные виды лечения. Например, исследователь может установить базовый уровень изучения поведения для деструктивного ученика (А), затем ввести лечение, предполагающее положительное внимание со стороны учителя (Б), а затем перейти к лечению, предполагающему мягкое наказание за то, что он не учится (С). Затем участника можно было вернуть к исходной фазе перед повторным введением каждого лечения - возможно, в обратном порядке, чтобы контролировать эффекты переноса. Этот конкретный реверсивный дизайн с несколькими обработками также может называться ABCACB-дизайном.


В чередующемся дизайне лечения два или более лечения чередуются относительно быстро по регулярному графику. Например, в один день может быть использовано положительное внимание к учебе, а в следующий день — мягкое наказание за то, что он не учится, и так далее. Или одно лечение можно проводить утром, а другое днем. Чередующийся дизайн лечения может быть быстрым и эффективным способом сравнения лечения, но только тогда, когда лечение быстро действует.


Множественные базовые планы

Есть две потенциальные проблемы с реверсивным дизайном, обе из которых связаны с удалением лечения. Во-первых, если лечение работает, его удаление может быть неэтичным. Например, если кажется, что лечение снижает частоту членовредительства у ребенка с отклонениями в развитии, было бы неэтично отменять это лечение только для того, чтобы показать, что число членовредительства увеличивается. Вторая проблема заключается в том, что зависимая переменная может не вернуться к исходному уровню после отмены лечения. Например, когда положительное внимание к учебе исчезает, учащийся может продолжать учиться с большей скоростью. Это может означать, что положительное внимание оказало длительное влияние на учебу студента, что, конечно, было бы хорошо. Но это также может означать, что положительное внимание на самом деле не было причиной усиленного обучения. Возможно, примерно в то же время, что и лечение, произошло что-то еще — например, родители ученика могли начать поощрять его за хорошие оценки.


Одним из решений этих проблем является использование плана с несколькими базовыми уровнями , который представлен на рис. 10.5 «Результаты общего исследования с несколькими базовыми уровнями» . В одном варианте плана для каждого из нескольких участников устанавливается исходный уровень, а затем для каждого вводится лечение. По сути, каждый участник тестируется в дизайне AB. Ключом к этому дизайну является то, что лечение проводится в разное время .для каждого участника. Идея состоит в том, что если зависимая переменная изменяется при введении лечения для одного участника, это может быть совпадением. Но если зависимая переменная изменяется, когда лечение вводится для нескольких участников, особенно когда лечение вводится в разное время для разных участников, то это крайне маловероятно, чтобы это было совпадением.


Рисунок 10.5 . Результаты типового исследования с несколькими исходными данными



Несколько базовых уровней могут относиться к разным участникам, зависимым переменным или настройкам. Лечение вводится в разное время на каждом базовом уровне.


В качестве примера рассмотрим исследование Скотта Росса и Роберта Хорнера (Ross & Horner, 2009). Росс, С.В., и Хорнер, Р.Х. (2009). Профилактика хулиганов в поддержке позитивного поведения. Журнал прикладного анализа поведения , 42 , 747–759.Их интересовало, как общешкольная программа по предотвращению издевательств влияет на агрессивное поведение отдельных проблемных учащихся. В каждой из трех разных школ исследователи изучали двух учеников, которые регулярно подвергались издевательствам. На начальном этапе они наблюдали за учащимися в течение 10-минутных периодов каждый день во время обеденного перерыва и подсчитывали количество агрессивного поведения, которое они проявляли по отношению к своим сверстникам. (Исследователи использовали портативные компьютеры для записи данных.) Через 2 недели они внедрили программу в одной школе. Еще через 2 недели внедрили во второй школе. И еще через 2 недели внедрили в третьей школе. Они обнаружили, что количество проявлений агрессивного поведения каждым учеником снизилось вскоре после того, как программа была внедрена в его или ее школе. Обратите внимание, что если бы исследователи изучали только одну школу или если бы они вводили лечение одновременно во всех трех школах, тогда было бы неясно, было ли снижение агрессивного поведения результатом программы издевательств или что-то еще, что произошло примерно в в то же время, когда оно было введено (например, праздник, телепрограмма, перемена погоды). Но с их дизайном с несколькими базовыми уровнями такое совпадение должно было произойти три раза — очень маловероятное событие — чтобы объяснить их результаты. телевизионная программа, изменение погоды). Но с их дизайном с несколькими базовыми уровнями такое совпадение должно было произойти три раза — очень маловероятное событие — чтобы объяснить их результаты. телевизионная программа, изменение погоды). Но с их дизайном с несколькими базовыми уровнями такое совпадение должно было произойти три раза — очень маловероятное событие — чтобы объяснить их результаты.


В другом варианте многобазового плана несколько исходников устанавливаются для одного и того же участника, но для разных зависимых переменных, и лечение вводится в разное время для каждой зависимой переменной. Представьте себе, например, исследование влияния постановки четких целей на производительность офисного работника, у которого есть две основные задачи: делать звонки и писать отчеты. Базовые уровни для обеих задач могут быть установлены. Например, исследователь может измерить количество телефонных звонков и отчетов, сделанных работником каждую неделю в течение нескольких недель. Затем для одной из этих задач может быть введена целеполагающая обработка, а позднее такая же обработка может быть введена для другой задачи. Логика та же, что и раньше. Если производительность по одной задаче повышается после введения лечения, неясно, вызвало ли лечение увеличение. Но если производительность при выполнении обеих задач возрастает после того, как лечение введено — особенно когда лечение проводится в два разных времени — тогда становится намного яснее, что за это ответственно лечение.


В еще одной третьей версии схемы с несколькими базовыми уровнями для одного и того же участника устанавливаются несколько базовых уровней, но в разных условиях. Например, базовый уровень может быть установлен для количества времени, которое ребенок проводит за чтением в свободное время в школе и в свободное время дома. Затем можно было бы ввести такое лечение, как позитивное внимание, сначала в школе, а затем дома. Опять же, если зависимая переменная изменяется после того, как лечение введено в каждой ситуации, это дает исследователю уверенность в том, что лечение действительно ответственно за изменение.


Анализ данных в исследованиях одного субъекта

Помимо сосредоточения внимания на отдельных участниках, исследования с одним субъектом отличаются от групповых тем, как обычно анализируются данные. Как мы видели на протяжении всей книги, групповые исследования включают в себя объединение данных по участникам. Групповые данные описываются с использованием статистики, такой как средние значения, стандартные отклонения, r Пирсона и т. д ., для выявления общих закономерностей. Наконец, статистика вывода используется, чтобы помочь решить, может ли результат для выборки распространиться на генеральную совокупность. Исследование одного субъекта, напротив, в значительной степени зависит от совершенно другого подхода, называемого визуальным осмотром .. Это означает построение данных отдельных участников, как показано на протяжении всей этой главы, внимательное изучение этих данных и вынесение суждений о том, влияла ли и в какой степени независимая переменная на зависимую переменную. Логическая статистика обычно не используется.


При визуальном просмотре своих данных исследователи одного субъекта принимают во внимание несколько факторов. Одним из них является изменение уровня зависимой переменной от состояния к состоянию. Если зависимая переменная намного выше или намного ниже в одном состоянии, чем в другом, это говорит о том, что лечение оказало эффект. Второй фактор – тренд ., который относится к постепенному увеличению или уменьшению зависимой переменной в наблюдениях. Если зависимая переменная начинает увеличиваться или уменьшаться при изменении условий, то это снова говорит о том, что воздействие оказало влияние. Это может быть особенно показательным, когда тенденция меняет направление — например, когда нежелательное поведение усиливается на исходном уровне, но затем начинает уменьшаться с введением лечения. Третий фактор — это задержка , то есть время, необходимое для того, чтобы зависимая переменная начала изменяться после изменения условий. В общем, если изменение зависимой переменной начинается вскоре после изменения условий, это предполагает, что причиной было лечение.


На верхней панели рисунка 10.6 видны довольно очевидные изменения уровня и тренда зависимой переменной от состояния к условию. Кроме того, латентность этих изменений короткая; изменение происходит немедленно. Эта схема результатов убедительно свидетельствует о том, что лечение было ответственным за изменения в зависимой переменной. На нижней панели рисунка 10.6, однако, изменения в уровне довольно малы. И хотя в условиях лечения наблюдается тенденция к увеличению, похоже, что это может быть продолжением тенденции, которая уже началась в исходном состоянии. Эта схема результатов убедительно свидетельствует о том, что лечение не было причиной каких-либо изменений в зависимой переменной — по крайней мере, не в той степени, которую обычно надеются увидеть исследователи, проводящие исследование одного субъекта.


Рисунок 10.6



Визуальный анализ данных показывает эффективное лечение на верхней панели и неэффективное лечение на нижней панели.


Результаты исследования одного субъекта также можно анализировать с помощью статистических процедур, и это становится все более распространенным явлением. Существует множество различных подходов, и исследователи, занимающиеся одним предметом, продолжают спорить о том, какой из них наиболее полезен. Один подход аналогичен тому, что обычно делается в групповых исследованиях. Среднее значение и стандартное отклонение ответов каждого участника при каждом условии вычисляются и сравниваются, и применяются логические статистические тесты, такие как t - критерий или дисперсионный анализ (Fisch, 2001). Фиш, Г.С. (2001). Оценка данных поведенческого анализа: визуальный осмотр или статистические модели. Поведенческие процессы , 54 , 137–154. (Обратите внимание, что усреднение поучастников встречается реже.) Другой подход заключается в вычислении процента неперекрывающихся данных (PND) для каждого участника (Scruggs & Mastropieri, 2001). Скраггс, Т.Е., и Мастропьери, Массачусетс (2001). Как подвести итог исследования с одним участником: идеи и приложения. Исключительность , 9 , 227–244.Это процент ответов в условиях лечения, которые являются более экстремальными, чем самые экстремальные ответы в соответствующих контрольных условиях. В исследовании Холла и его коллег, например, все показатели времени исследования Робби в первом состоянии лечения были выше, чем самый высокий показатель в первом исходном состоянии, для PND 100%. Чем больше процент неперекрывающихся данных, тем сильнее эффект обработки. Тем не менее, формальные статистические подходы к анализу данных в исследованиях одного субъекта обычно считаются дополнением к визуальному осмотру, а не его заменой.


КЛЮЧЕВЫЕ ВЫВОДЫ

Планы исследований с одним субъектом обычно включают многократное измерение зависимой переменной с течением времени и изменение условий (например, от исходного уровня до лечения), когда зависимая переменная достигает устойчивого состояния. Этот подход позволяет исследователю увидеть, вызывают ли изменения независимой переменной изменения зависимой переменной.

В обратном плане участник тестируется в исходном состоянии, затем тестируется в состоянии лечения, а затем возвращается к исходному состоянию. Если зависимая переменная изменяется при введении лечения, а затем возвращается к исходному состоянию, это является убедительным доказательством эффекта лечения.

В дизайне с несколькими базовыми уровнями базовые уровни устанавливаются для разных участников, разных зависимых переменных или разных условий, и лечение вводится в разное время на каждом базовом уровне. Если введение лечения сопровождается изменением зависимой переменной на каждом исходном уровне, это дает убедительные доказательства эффекта лечения.

Исследователи-одиночки обычно анализируют свои данные, изображая их в виде графиков и вынося суждения о том, влияет ли независимая переменная на зависимую переменную на основе уровня, тенденции и задержки.

УПРАЖНЕНИЯ

Практика: спланируйте простое исследование с одним субъектом (используя обратный или множественный базовый план), чтобы ответить на следующие вопросы. Обязательно укажите обработку, оперативно определите зависимую переменную, решите, когда и где будут проводиться наблюдения и т. д.


Повышает ли положительное внимание родителей желание ребенка чистить зубы?

Улучшает ли самопроверка во время учебы успеваемость учащегося в еженедельных тестах по правописанию?

Помогают ли регулярные физические упражнения избавиться от депрессии?

Практика: Создайте график, отображающий гипотетические результаты исследования, разработанного вами в упражнении 1. Напишите абзац, в котором вы описываете, что показывают результаты. Обязательно прокомментируйте уровень, тенденцию и задержку.

10.3 «Дебаты» между одним субъектом и группой

ЦЕЛИ ОБУЧЕНИЯ

Объясните некоторые моменты разногласий между сторонниками исследования одного субъекта и сторонниками группового исследования.

Определите несколько ситуаций, в которых уместно исследование с одним субъектом, и несколько других, в которых уместно групповое исследование.

Исследование одного субъекта во многом похоже на групповое исследование, особенно исследование экспериментальной группы. Оба они являются количественными подходами, которые пытаются установить причинно-следственные связи, манипулируя независимой переменной, измеряя зависимую переменную и контролируя посторонние переменные. Но между этими подходами есть и важные различия, и эти различия иногда приводят к разногласиям. Стоит рассмотреть наиболее распространенные моменты разногласий между исследователями, проводящими исследования одного субъекта, и исследователями групп, а также то, как эти разногласия могут быть разрешены. Как мы увидим, исследование одного субъекта и групповое исследование, вероятно, лучше всего рассматривать как взаимодополняющие подходы.


Анализ данных

Один набор разногласий вращается вокруг проблемы анализа данных. Некоторые сторонники группового исследования обеспокоены тем, что визуальный осмотр недостаточен для принятия решения о том, повлияло ли лечение на зависимую переменную и в какой степени. Одна особая проблема заключается в том, что визуальный осмотр недостаточно чувствителен для обнаружения слабых эффектов. Во-вторых, визуальный осмотр может быть ненадежным, поскольку разные исследователи приходят к разным выводам об одном и том же наборе данных (Danov & Symons, 2008). Данов, С.Е., и Саймонс, Ф.Е. (2008). Обзорная оценка достоверности графиков визуального осмотра и функционального анализа. Модификация поведения , 32 , 828–839.В-третьих, результаты визуального осмотра — общее суждение о том, было ли лечение эффективным, — нельзя четко и эффективно обобщить или сравнить между исследованиями (в отличие от показателей силы отношений, обычно используемых в групповых исследованиях).


В целом, исследователи одного предмета разделяют эти опасения. Однако они также утверждают, что использование ими стратегии устойчивого состояния в сочетании с акцентом на сильных и последовательных эффектах сводит к минимуму большинство из них. Если эффект лечения трудно обнаружить при визуальном осмотре, потому что эффект слабый или данные зашумлены, то исследователи с одним субъектом ищут способы увеличить силу эффекта или уменьшить шум в данных, контролируя посторонние переменные. (например, проводя лечение более последовательно). Если эффект все еще трудно обнаружить, то они, вероятно, сочтут его недостаточно сильным и не достаточно последовательным, чтобы представлять дальнейший интерес.Скраггс, Т.Е., и Мастропьери, Массачусетс (2001). Как подвести итог исследования с одним участником: идеи и приложения. Исключительность , 9 , 227–244.


Переворачивая столы, некоторые сторонники исследования одного субъекта беспокоятся о том, как групповые исследователи анализируют свои данные. В частности, они отмечают, что сосредоточение внимания на групповых средствах может ввести в заблуждение. Опять же, представьте, что лечение оказывает сильное положительное влияние на половину людей, подвергшихся ему, и столь же сильное отрицательное влияние на другую половину. В традиционном эксперименте между испытуемыми положительный эффект на половину участников в условиях лечения был бы статистически нейтрализован отрицательным эффектом на другую половину. Тогда среднее значение для группы лечения будет таким же, как среднее значение для контрольной группы, что создаст впечатление, что лечение не оказало никакого эффекта, хотя на самом деле оно оказало сильное влияние на каждого участника!


Но опять же, групповые исследователи разделяют эту озабоченность. Хотя они сосредоточены на групповой статистике, они также подчеркивают важность изучения распределения индивидуальных оценок. Например, если на одних участников лечение повлияло положительно, а на других отрицательно, это приведет к бимодальному распределению баллов, и его можно будет обнаружить, посмотрев на гистограмму данных. Использование внутрисубъектных планов — еще одна стратегия, которая позволяет групповым исследователям наблюдать эффекты на индивидуальном уровне и даже определять, какой процент людей проявляет сильные, средние, слабые и даже отрицательные эффекты.


Внешняя валидность

Второй вопрос, по которому иногда расходятся отдельные испытуемые и групповые исследователи, касается внешней валидности — способности обобщать результаты исследования за пределы реально изучаемых людей и ситуаций. В частности, сторонники групповых исследований указывают на сложность определения того, могут ли результаты, полученные всего несколькими участниками, быть распространены на другие группы населения. Представьте, например, что в исследовании с участием одного субъекта было показано, что лечение снижает самоповреждения для каждого из двух детей с отклонениями в развитии. Даже если эффект будет сильным для этих двух детей, как можно узнать, сработает ли это лечение для других детей с отклонениями в развитии?


Опять же, исследователи одного субъекта разделяют эту озабоченность. В ответ они отмечают, что сильные и устойчивые эффекты, в которых они обычно заинтересованы, даже если они наблюдаются в небольших выборках, скорее всего, распространятся на других в популяции. Исследователи, работающие с отдельными субъектами, также отмечают, что они уделяют большое внимание воспроизведению результатов своих исследований. Когда они наблюдают эффект с небольшой выборкой участников, они обычно пытаются воспроизвести его с другой небольшой выборкой — возможно, с немного другим типом участников или в немного других условиях. Каждый раз, когда они наблюдают подобные результаты, они по праву становятся более уверенными в общности этих результатов.


И снова переворачивая столы, исследователи одного субъекта имеют свои собственные опасения по поводу внешней валидности группового исследования. Один чрезвычайно важный момент, который они отмечают, заключается в том, что изучение больших групп участников не решает полностью проблему обобщения на других людей . Представьте себе, например, лечение, которое, как было показано в исследовании большой группы, в среднем дает небольшой положительный эффект. Вполне вероятно, что хотя многие участники продемонстрировали небольшой положительный эффект, другие продемонстрировали большой положительный эффект, а третьи — небольшой отрицательный эффект. Когда дело доходит до применения этого лечения к другой большой группе , мы можем быть уверены, что в среднем оно будет иметь небольшой эффект. Но когда дело доходит до применения этого лечения к другомуиндивидуально , мы не можем быть уверены, будет ли это иметь малый, большой или даже отрицательный эффект. Еще один момент, на который обращают внимание исследователи отдельных субъектов, заключается в том, что групповые исследователи также сталкиваются с аналогичной проблемой, когда изучают одну ситуацию, а затем обобщают свои результаты на другие ситуации. Например, исследователи, изучающие влияние использования сотовых телефонов на водителей на закрытой овальной трассе, вероятно, захотят применить свои результаты к водителям во многих других реальных ситуациях вождения. Но обратите внимание, что это требует обобщения от одной ситуации до совокупности ситуаций. Таким образом, способность обобщать основывается не только на количестве изученных участников. Он требует тщательного рассмотрения сходства участников иситуации, изучаемые для совокупности участников и ситуаций, которые нужно обобщить (Shadish, Cook, & Campbell, 2002). Шадиш, В. Р., Кук, Т. Д., и Кэмпбелл, Д. Т. (2002). Экспериментальные и квазиэкспериментальные планы для обобщенного причинно-следственного вывода . Бостон, Массачусетс: Хоутон Миффлин.


Индивидуальное и групповое исследование как взаимодополняющие методы

Как и в случае с количественными и качественными исследованиями, вероятно, лучше всего концептуализировать исследования одного субъекта и групповые исследования как дополняющие друг друга методы, которые имеют разные сильные и слабые стороны и подходят для ответов на различные исследовательские вопросы (Каздин, 1982). Каздин, А.Е. (1982). Индивидуальные дизайны исследований: методы для клинических и прикладных условий . Нью-Йорк, штат Нью-Йорк: Издательство Оксфордского университета.Исследования с одним субъектом особенно хороши для проверки эффективности лечения на отдельных людях, когда основное внимание уделяется сильным, последовательным и биологически или социально важным эффектам. Это особенно полезно, когда интересует поведение конкретных лиц. Клиницисты, которые работают одновременно только с одним человеком, могут обнаружить, что это их единственный вариант систематического количественного исследования.


Групповые исследования, с другой стороны, хороши для проверки эффективности лечения на групповом уровне. Одним из преимуществ этого подхода является то, что он позволяет обнаруживать слабые эффекты, которые могут представлять интерес по многим причинам. Например, обнаружение слабого лечебного эффекта может привести к усовершенствованию лечения, что в итоге приведет к большему и значимому эффекту. Групповые исследования также хороши для изучения взаимодействия между видами лечения и характеристиками участников. Например, если лечение эффективно для тех, у кого высокая мотивация к изменению, и неэффективно для тех, у кого низкая мотивация к изменению, то групповой план может обнаружить это намного эффективнее, чем план с одним субъектом. Групповое исследование также необходимо для ответа на вопросы, которые нельзя решить с помощью односубъектного подхода.


Наконец, важно понимать, что односубъектный и групповой подходы представляют разные исследовательские традиции. Этот фактор, вероятно, является наиболее важным, влияющим на то, какой подход использует исследователь. Исследователи, занимающиеся экспериментальным анализом поведения и прикладным анализом поведения, учатся концептуализировать свои исследовательские вопросы способами, которые подходят для подхода с одним субъектом. Исследователи в большинстве других областей психологии учатся концептуализировать свои исследовательские вопросы способами, которые поддаются групповому подходу. В то же время в психологии есть много тем, в которых исследования двух традиций информировали друг друга и были успешно интегрированы.Дехане, С. (2011). Чувство числа: как разум создает математику (2-е изд.). Нью-Йорк, штат Нью-Йорк: Оксфорд. Индивидуальные исследования с крысами и птицами и групповые исследования с человеческими младенцами показали поразительно схожие способности этих популяций различать небольшое количество объектов и событий. Это чувство числа, которое, вероятно, развилось задолго до появления человека, может быть даже основой передовых математических способностей человека.


КЛЮЧЕВЫЕ ВЫВОДЫ

Различия между исследованиями одного субъекта и исследованиями группы иногда приводят к разногласиям между исследователями одного субъекта и группой исследователей. Эти разногласия сосредоточены на вопросах анализа данных и внешней валидности (особенно обобщения на других людей).

Индивидуальные исследования и групповые исследования, вероятно, лучше всего рассматривать как взаимодополняющие методы с разными сильными и слабыми сторонами, которые подходят для ответов на различные виды исследовательских вопросов.

УПРАЖНЕНИЯ

Обсуждение: Представьте, что вы провели исследование с участием одного субъекта, показывающее положительный эффект лечения на поведение мужчины с социальным тревожным расстройством. Ваше исследование подверглось критике на том основании, что его нельзя распространить на другие. Как бы вы могли отреагировать на эту критику?

Обсуждение: Представьте, что вы провели групповое исследование, показывающее положительное влияние лечения на поведение группы людей с социальным тревожным расстройством, но ваше исследование подверглось критике на том основании, что «усредненные» эффекты нельзя распространить на отдельных лиц. Как бы вы могли отреагировать на эту критику?

Практика: перепланируйте как групповое исследование исследование Холла и его коллег, описанное в начале этой главы, и перечислите сильные и слабые стороны вашего нового исследования по сравнению с исходным исследованием.

Практика: эффект генерации относится к тому факту, что люди, которые генерируют информацию по мере ее изучения (например, путем самопроверки), позже вспоминают ее лучше, чем люди, которые просто просматривают информацию. Разработайте индивидуальное исследование эффекта генерации для студентов колледжей, изучающих анатомию мозга.




Представление вашего исследования

Исследование считается завершенным только тогда, когда его результаты доводятся до сведения научного сообщества.


Американская психологическая ассоциация


Представьте, что вы определили интересный исследовательский вопрос, просмотрели соответствующую литературу, разработали и провели эмпирическое исследование, проанализировали данные и сделали выводы. Есть еще один шаг в процессе проведения научных исследований. Пришло время добавить ваше исследование в литературу, чтобы другие могли извлечь из него уроки и развить их. Помните, что наука — это социальный процесс — крупномасштабное сотрудничество многих исследователей, распределенных в пространстве и времени. По этой причине можно утверждать, что до тех пор, пока вы не опубликуете свои исследования в той или иной форме, вы вообще не будете заниматься наукой.


В этой главе мы рассмотрим, как эффективно представить свое исследование. Мы начнем с обсуждения стиля Американской психологической ассоциации (АПА) — основного подхода к письму, используемого исследователями в области психологии и смежных областях. Затем мы рассмотрим, как написать отчет об эмпирическом исследовании в стиле APA. Наконец, мы рассмотрим некоторые из многих других способов, которыми исследователи представляют свою работу, включая обзорные и теоретические статьи, тезисы и другие студенческие работы, а также доклады и плакаты на профессиональных встречах.


11.1 Стиль Американской психологической ассоциации (АПА)

ЦЕЛИ ОБУЧЕНИЯ

Дайте определение стилю APA и перечислите несколько его наиболее важных характеристик.

Определите три уровня стиля АРА и приведите примеры каждого из них.

Определите несколько источников информации о стиле APA.

Что такое стиль АПА?

Стиль APA представляет собой набор рекомендаций по написанию статей в области психологии и смежных областях. Эти рекомендации изложены в Руководстве по публикациям Американской психологической ассоциации (APA, 2006). Американская психологическая ассоциация. (2006). Руководство по публикации Американской психологической ассоциации (6-е изд.). Вашингтон, округ Колумбия: Американская психологическая ассоциация. Руководство по публикациям появилось в 1929 г. как короткая журнальная статья, в которой излагались основные стандарты подготовки рукописей к публикации (Bentley et al., 1929). Бентли, М., Пиренбум, Калифорния, Ходж, Ф.В., Пассано, Э.Б., Уоррен, Х.К., и Уошберн, М.Ф. (1929). Инструкции по подготовке рукописи.Психологический бюллетень, 26 , 57–63. Позже она была расширена и опубликована ассоциацией в виде книги, и сейчас она находится в шестом издании. Основная цель стиля APA - облегчить научное общение, способствуя ясности выражения и стандартизируя организацию и содержание исследовательских статей и глав книг. Писать об исследованиях легче, когда вы знаете, какую информацию представлять, в каком порядке ее представлять и даже в каком стиле ее представлять. Точно так же легче читать об исследованиях, когда они представлены знакомым и ожидаемым образом.


Стиль APA лучше всего рассматривать как «жанр» письма, который подходит для представления результатов психологических исследований, особенно в академическом и профессиональном контексте. Это не синоним «хорошего письма» в целом. Вы не стали бы писать литературный анализ для урока английского языка, даже если бы он был основан на психоаналитических концепциях в стиле АПА. Вместо этого вы бы написали это в стиле Modern Language Association (MLA). И вы бы не написали газетную статью, даже если бы она была о новом прорыве в поведенческой нейробиологии, в стиле АПА. Вместо этого вы бы написали это в стиле Associated Press (AP). В то же время вы не стали бы писать отчет об эмпирическом исследовании в стиле MLA, в стиле AP или в стиле любовного романа, электронного письма другу или списка покупок. Вы бы написали это в стиле АПА.


Уровни стиля АПА

Поскольку стиль APA состоит из большого количества и разнообразия руководств (Руководство по публикациям состоит почти из 300 страниц), может быть полезно рассматривать его с точки зрения трех основных уровней. Во-первых, это общая организация статьи (о ней рассказывается в главе 2 «Начало исследований» Руководства по публикациям ). Отчеты об эмпирических исследованиях, в частности, имеют несколько отдельных разделов, которые всегда появляются в одном и том же порядке:


Титульная страница. Представляет название статьи и имена авторов и организации.

Абстрактный. Подводит итог исследования.

Введение. Описывает предыдущие исследования и обоснование текущего исследования.

Метод. Описывает, как проводилось исследование.

Полученные результаты. Описывает результаты исследования.

Обсуждение. Подводит итоги исследования и обсуждает его последствия.

Использованная литература. Список ссылок, цитируемых в статье.

Второй уровень стиля APA можно назвать стилем высокого уровня (рассматривается в главе 3 «Этика исследований» Руководства по публикации).), который включает рекомендации по четкому выражению идей. Здесь есть две важные темы. Во-первых, письмо в стиле APA носит формальный, а не неформальный характер. Он принимает тон, подходящий для общения с профессиональными коллегами — другими исследователями и практиками, — которые разделяют интерес к теме. Однако помимо этого общего интереса эти коллеги не обязательно похожи на писателя или друг на друга. Аспирант в Калифорнии может писать статью, которую прочитают молодой психотерапевт из Нью-Йорка и уважаемый профессор психологии в Токио. Таким образом, формальное письмо избегает сленга, сокращений, ссылок на поп-культуру, юмора и других элементов, которые были бы приемлемы в разговоре с другом или в неформальном письме.


Вторая особенность высокоуровневого стиля APA заключается в том, что он прямолинеен. Это означает, что он передает идеи как можно проще и яснее, сосредоточив внимание на самих идеях, а не на том, как они сообщаются. Таким образом, письмо в стиле APA сводит к минимуму литературные приемы, такие как метафоры, образы, ирония, неизвестность и так далее. Опять же, юмор сведен к минимуму. Фразы короткие и прямые. Необходимо использовать технические термины, но они используются для улучшения коммуникации, а не просто для того, чтобы текст звучал более «научно». Например, если участники погрузили руки в ведро с ледяной водой, лучше просто написать это, чем написать, что они «подвергались воздействию аппарата для стимуляции боли». В то же время, однако, нет лучшего способа сообщить об использовании модели между субъектами, чем использование термина «план между субъектами».


Стиль АПА и ценности психологии

Роберт Мэдиган и его коллеги утверждали, что цель стиля APA часто остается незамеченной (Madigan, Johnson, & Linton, 1995). Мэдиган Р., Джонсон С. и Линтон П. (1995). Язык психологии: стиль АПА как эпистемология. Американский психолог, 50 , 428–436. В частности, он продвигает научные ценности и предположения психологов. С этой точки зрения многие особенности стиля APA, которые на первый взгляд кажутся произвольными, на самом деле имеют смысл. Ниже приведены некоторые особенности письма в стиле APA и научные ценности или предположения, которые они отражают.


Функция стиля APA Научная ценность или предположение

Прямых цитат других исследователей очень мало. Явления и теории психологии объективны и не зависят от конкретных слов, которыми их описывает конкретный исследователь.

Критика направлена ​​на работу других исследователей, но не на них лично. В центре внимания научных исследований находятся общие выводы о мире, а не о личностях конкретных исследователей.

Есть много ссылок и справочных цитат. Научные исследования — это крупномасштабное сотрудничество многих исследователей.

Отчеты об эмпирических исследованиях состоят из определенных разделов в фиксированном порядке. Существует идеальный подход к проведению эмпирических исследований в психологии (даже если этот идеал не всегда достигается в реальных исследованиях).

Исследователи склонны «застраховывать» свои выводы, например: «Результаты предполагают , что…» Научные знания носят предварительный характер и всегда подлежат пересмотру на основе новых эмпирических результатов.

Другим важным элементом стиля APA высокого уровня является избегание выражений, предвзятых по отношению к определенным группам. Это делается не только для того, чтобы не обидеть людей — зачем вам оскорблять людей, интересующихся вашей работой? — но и ради научной объективности и точности. Например, термин « сексуальная ориентация » следует использовать вместо сексуального предпочтения , потому что люди обычно не воспринимают свою ориентацию как «предпочтение» и ее не так легко изменить, как предполагает этот термин (Committee on Lesbian and Gay Concerns, APA, 1991). . Комитет по проблемам лесбиянок и геев, Американская психологическая ассоциация. (1991). Избегайте гетеросексуальной предвзятости в языке. Американский психолог, 46 , 973–974. Извлекаются изhttp://www.apa.org/pi/lgbt/resources/language.aspx


Общие принципы избежания предвзятого языка довольно просты. Во-первых, будьте чувствительны к ярлыкам, избегая терминов, которые являются оскорбительными или имеют негативный оттенок. Это включает в себя термины, которые идентифицируют людей с расстройствами или другими проблемами, которые у них есть. Например, больным шизофренией лучше, чем шизофреникам . Во-вторых, используйте более конкретные термины, а не более общие. Например, американцы мексиканского происхождения лучше, чем латиноамериканцы , если все в группе на самом деле американцы мексиканского происхождения. В-третьих, избегайте объективации участников исследования. Вместо этого признайте их активный вклад в исследование. Например, « Студенты заполнили анкету» лучше, чем « Студенты заполнили анкету».испытуемым задавали анкету». Обратите внимание, что этот принцип также способствует более четкому и увлекательному письму. В таблице 11.1 «Примеры избегания предвзятого языка» приведены еще несколько примеров, которые следуют этим общим принципам.


Таблица 11.1 Примеры того, как избегать предвзятого языка


Вместо… Использовать…

мужчина, мужчины мужчины и женщины, люди

пожарные пожарные

гомосексуалы, геи, бисексуалы лесбиянки, геи, бисексуальные мужчины, бисексуальные женщины

меньшинство ярлык конкретной группы (например, афроамериканец)

невротики люди с высоким уровнем невротизма

особые дети дети с ограниченными возможностями обучения

В предыдущем издании Руководства по публикации настоятельно не рекомендовалось использовать термин « субъекты » (за исключением не-людей) и настоятельно рекомендовалось вместо этого использовать термин « участники ». Текущее издание, однако, признает, что субъекты все еще могут быть уместны в отношении участников-людей в областях, в которых это традиционно использовалось (например, базовые исследования памяти). Но это также поощряет использование более конкретных терминов, когда это возможно: студенты колледжа , дети , респонденты и так далее.


Третий уровень стиля АРА можно назвать стилем низкого уровня (который рассматривается в главах 4 «Теория в психологии» по Главе 7 «Неэкспериментальные исследования» Руководства по публикации ). Стиль низкого уровня включает в себя все конкретные рекомендации, относящиеся к к орфографии, грамматике, ссылкам и справочным цитатам, числам и статистике, рисункам и таблицам и так далее. Существует так много руководств низкого уровня, что даже опытным профессионалам необходимо время от времени обращаться к Руководству по публикации . Таблица 11.2 «10 основных ошибок стиля APA»содержит некоторые из наиболее распространенных типов ошибок стиля APA, основанные на анализе рукописей, представленных в один профессиональный журнал за 6-летний период (Onwuegbuzie, Combs, Slate, & Frels, 2010). Онвуэгбузи, А.Дж., Комбс, Дж.П., Слейт, Дж.Р., и Фрелс, Р.К. (2010). От редакции: основанные на фактических данных рекомендации по избежанию наиболее распространенных ошибок APA при подаче журнальных статей. Исследования в школах, 16 , ix–xxxvi. Эти ошибки были совершены профессиональными исследователями, но, вероятно, они аналогичны тем, которые чаще всего допускают и студенты. См. также примечание 11.8 «Онлайн-ресурсы по стилю APA» в этом разделе и, конечно же, само Руководство по публикации .


Таблица 11.2. 10 основных ошибок стиля APA


Тип ошибки Пример

1. Использование чисел Неумение использовать цифры для 10 и выше

2. Расстановка переносов Отсутствие переноса сложных прилагательных, которые предшествуют существительному (например, «техника ролевой игры» должна быть «техникой ролевой игры»)

3. Использование и др. Неиспользование после первого цитирования ссылки

4. Заголовки Не правильное использование заглавных букв

5. Использование с тех пор Использование так как означает, потому что

6. Таблицы и рисунки Не форматировать их в стиле APA; повторение информации, которая уже дана в тексте

7. Использование запятых Отсутствие запятой перед и или или в ряду из трех или более элементов

8. Использование сокращений Неспособность полностью расшифровать термин, прежде чем ввести для него аббревиатуру.

9. Интервал Не всегда двойной интервал между строками

10. Использование & в ссылках Использование & в тексте или и в скобках

Интернет-ресурсы по стилю APA

Лучшим источником информации о стиле APA является само руководство по публикации . Тем не менее, есть также много хороших веб-сайтов по стилю APA, которые отлично справляются с представлением основ для начинающих исследователей. Вот несколько из них.


Стиль АПА


http://www.apastyle.org


APA Style Lite от Doc Scribe


http://www.docstyles.com/apalite.htm


Онлайн-лаборатория письма Purdue


http://owl.english.purdue.edu/owl/resource/560/01


Основы стиля APA Дугласа Дегельмана


http://www.vanguard.edu/Home/AcademicResources/Faculty/DougDegelman/APAStyleEssentials.aspx


Ссылки и цитаты в стиле APA

Поскольку наука представляет собой крупномасштабное сотрудничество между исследователями, ссылки на работы других исследователей чрезвычайно важны. Их важность отражена в обширном и подробном наборе правил их форматирования и использования.


использованная литература

В конце статьи или главы книги в стиле АРА находится список, содержащий ссылки на все работы, цитируемые в тексте (и только те работы, которые цитируются в тексте). Список литературы начинается на отдельной странице с заголовком «Ссылки», расположенным по центру прописными и строчными буквами. Сами ссылки затем перечислены в алфавитном порядке в соответствии с фамилиями первого названного автора для каждой цитаты. (Как и в остальной части рукописи в стиле APA, все напечатано через два интервала.) В статьях и главах книг в стиле APA можно цитировать множество различных работ, включая журнальные статьи, веб-сайты, правительственные документы и даже телешоу. Конечно, вам следует обратиться к Руководству по публикации .или Интернет-ресурсы по стилю APA для получения подробной информации о том, как их форматировать. Здесь мы сосредоточимся на форматировании ссылок для трех наиболее распространенных видов работ, цитируемых в стиле APA: журнальных статей, книг и глав книг.


Журнальная статья

Для журнальных статей общий формат ссылки выглядит следующим образом:


Автор, AA, Автор, BB и Автор, CC (год). Название статьи. Название журнала, xx , стр–стр. дои: хх.хххххххххх


Вот конкретный пример:


Адаир, Дж. Г., и Вохра, Н. (2003). Взрыв знаний, ссылок и цитат: уникальный ответ психологии на кризис. Американский психолог, 58 , 15–23. DOI: 10.1037/0003-066X.58.1.15


Здесь следует отметить несколько вещей. Ссылка включает висячий отступ. То есть первая строка ссылки не имеет отступа, но все последующие строки имеют отступ. Имена авторов появляются в том же порядке, что и в статье, что отражает относительный вклад авторов в исследование. Появляются только фамилии и инициалы авторов, а имена разделяются запятыми с амперсандом (&) между последними двумя. Это верно, даже когда есть только два автора. Только первое слово названия статьи пишется с большой буквы. Единственными исключениями являются слова, которые являются именами собственными или прилагательными (например, «по Фрейду»), или если есть подзаголовок, и в этом случае первое слово подзаголовка также пишется с заглавной буквы. Однако в названии журнала все важные слова пишутся с большой буквы. Название журнала и номер тома выделены курсивом. В самом конце ссылки находится цифровой идентификатор объекта (DOI), который обеспечивает постоянную ссылку на местонахождение статьи в Интернете. Включите это, если оно доступно. Обычно его можно найти в записи об элементе в электронной базе данных (например, PsycINFO) и обычно он отображается на первой странице опубликованной статьи.


Книги

Для книги общий формат и конкретный пример таковы:


Автор, А.А. (год). Название книги . Местонахождение: Издательство.


Милгрэм, С. (1974). Повиновение авторитету: экспериментальный взгляд . Нью-Йорк, штат Нью-Йорк: Harper & Row.


Главы книги

Для главы в отредактированной книге общий формат и конкретный пример таковы:


Автор, AA, Автор, BB и Автор, CC (год). Название главы. В редакторе AA, редакторе BB и редакторе CC (редакторы), название книги (стр. xxx – xxx). Местонахождение: Издательство.


Лилиенфельд, С.О., и Линн, С.Дж. (2003). Диссоциативное расстройство личности: множественные личности, множественные противоречия. В С. О. Лилиенфельд, С. Дж. Линн и Дж. М. Лор (ред.), Наука и лженаука в клинической психологии (стр. 109–142). Нью-Йорк, штат Нью-Йорк: Guilford Press.


Обратите внимание, что ссылки на книги и главы в книгах аналогичны ссылкам на журнальные статьи, но есть и некоторые отличия. Для отредактированной книги имена редакторов появляются с их первыми и средними инициалами, за которыми следуют их фамилии (а не наоборот) — с аббревиатурой «Eds». (или «Ред.», если есть только один) в круглых скобках сразу после имени окончательного редактора. Заглавными буквами пишется только первое слово названия книги (за исключением названий статей), а все название выделяется курсивом. Для главы в отредактированной книге номера страниц главы указываются в скобках после названия книги с аббревиатурой «стр.» Наконец, оба формата заканчиваются местом публикации и издателем, разделенными двоеточием.


Справочные цитаты

Когда вы ссылаетесь на идею другого исследователя, вы должны включить справочную цитату(в тексте) на работу, в которой первоначально появилась эта идея, и полную ссылку на эту работу в списке литературы. Что считается идеей, которую необходимо процитировать? Как правило, сюда входят явления, открытые другими исследователями, разработанные ими теории, выведенные ими гипотезы и конкретные методы, которые они использовали (например, специальные анкеты или стимулирующие материалы). Цитаты должны также появляться для фактической информации, которая не является общеизвестной, чтобы другие исследователи могли проверить эту информацию для себя. Например, в статье о влиянии использования сотового телефона на способность управлять автомобилем автор может привести официальную статистику о количестве аварий, связанных с мобильным телефоном, которые происходят каждый год. Среди идей, не нуждающихся в цитировании, широко распространены методологические и статистические концепции (например, межсубъектный план,t test) и утверждения, которые настолько широки, что с ними трудно спорить (например, «Рабочая память играет роль во многих повседневных действиях»). Однако будьте осторожны, потому что «общеизвестные знания» о человеческом поведении часто неверны. Поэтому, если вы сомневаетесь, найдите соответствующую ссылку, чтобы процитировать или удалить сомнительное утверждение.


Когда вы цитируете произведение в тексте своей рукописи, есть два способа сделать это. Оба включают только фамилии авторов и год публикации. Первый метод заключается в использовании в предложении фамилий авторов (без имен и инициалов), за которыми сразу следует год публикации в скобках. Вот некоторые примеры:


Бургер (2008) повторил оригинальное исследование послушания Милграма (1963).


Хотя многие считают, что женщины более разговорчивы, чем мужчины, Мель, Вазире, Рамирес-Эспарса, Слэтчер и Пеннебейкер (2007) не обнаружили практически никакой разницы в количестве слов, произносимых студентами мужского и женского пола.


Обратите внимание на несколько вещей. Во-первых, имена авторов грамматически трактуются как имена людей, а не вещей. Лучше написать «воспроизведение исследования Милгрэма (1963)», чем «воспроизведение Милгрэма (1963)». Во-вторых, при наличии двух авторов имена не выделяются запятыми, а при наличии трех и более авторов — выделяются. В-третьих, для соединения имен авторов используется слово и (а не амперсанд). В-четвертых, год следует сразу после окончательного имени автора. Дополнительный момент, который не проиллюстрирован в этих примерах, но проиллюстрирован в образце документа в Разделе 11.2 «Написание исследовательского отчета в стиле Американской психологической ассоциации (АПА)» , заключается в том, что год необходимо указывать только в первый раз, когда конкретный работа цитируется в том же абзаце.


Второй способ процитировать статью или главу книги — в скобках, включая фамилии авторов и год публикации в скобках после идеи, которая упоминается. Вот некоторые примеры:


Люди могут быть на удивление послушны авторитетным фигурам (Burger, 2008; Milgram, 1963).


Последние данные свидетельствуют о том, что мужчины и женщины одинаково разговорчивы (Mehl, Vazire, Ramirez-Esparza, Slatcher, & Pennebaker, 2007).


Одна вещь, которую следует отметить в отношении таких цитат в скобках, заключается в том, что они часто помещаются в конце предложения, что сводит к минимуму их нарушение в потоке этого предложения. В отличие от первого способа цитирования работы, этот способ всегда включает год, даже если цитата дается несколько раз в одном и том же абзаце. Обратите также внимание на то, что при наличии нескольких цитат в одном и том же наборе круглых скобок они упорядочены в алфавитном порядке по имени первого автора и разделены точкой с запятой.


Строгих правил для определения того, какой из двух стилей цитирования использовать, не существует. Большинство статей и глав книг содержат смесь обоих. В целом, однако, первый подход хорошо работает, когда вы хотите выделить человека, проводившего исследование, например, если вы сравнивали теории двух выдающихся исследователей. Это также хорошо работает, когда вы подробно описываете конкретное исследование. Второй подход хорошо работает, когда вы обсуждаете общую идею и особенно когда вы хотите включить несколько ссылок на одну и ту же идею.


Третья наиболее распространенная ошибка в таблице 11.2 «10 основных ошибок стиля APA» связана с использованием et al. Это сокращение от латинского термина et alia , что означает «и другие». В стиле APA, если у статьи или главы книги более двух авторов, вы должны указать все их имена при первом цитировании этой работы. Однако после этого вы должны использовать имя первого автора, за которым следует «и др.». Вот некоторые примеры:


Напомним, что Mehl et al. (2007) обнаружили, что женщины и мужчины произносят в среднем примерно одинаковое количество слов в день.


Существует сильная положительная корреляция между количеством ежедневных неприятностей и количеством симптомов, которые испытывают люди (Kanner et al., 1981).


Обратите внимание, что между именем первого автора и «и др.» нет запятой. Обратите также внимание, что после «et» нет точки, но есть точка после «al». Это потому, что «et» — это полное слово, а «al». является аббревиатурой слова алия .


КЛЮЧЕВЫЕ ВЫВОДЫ

Стиль АПА представляет собой набор рекомендаций по написанию статей по психологии. Это жанр письма, который психологи используют для общения о своих исследованиях с другими исследователями и практиками.

Стиль APA можно рассматривать как имеющий три уровня. Существует организация исследовательской статьи, стиль высокого уровня, который включает в себя формальное и прямое написание, и стиль низкого уровня, который состоит из множества конкретных правил грамматики, орфографии, форматирования ссылок и так далее.

Ссылки и справочные цитаты являются важной частью стиля APA. Существуют определенные правила оформления ссылок и их цитирования в тексте статьи.

УПРАЖНЕНИЯ

Практика: Найдите описание исследования в популярном журнале, газете, блоге или на веб-сайте. Затем определите пять конкретных различий между тем, как написано это описание, и тем, как оно было бы написано в стиле APA.

Практика: найдите и исправьте ошибки в следующих вымышленных ссылках и цитатах в стиле APA.


Уолтерс, Ф.Т., и ДеЛеон, М. (2010). Взаимосвязь между внутренней мотивацией и точностью академической самооценки старшеклассников. Педагогическая психология Ежеквартально , 23, 234–256.

Мур, Лилия С. (2007). Этика опросных исследований. В М. Уильямс и П.Л. Ли (ред.), Этические проблемы психологии (стр. 120–156), Бостон, издательство Psychological Research Press.

Ванг К., Дюмон Л.С. и Прескотт М.П. обнаружили, что левши больше отдают предпочтение абстрактному искусству, чем правши (2006).

Этот результат повторялся несколько раз (Williamson, 1998; Pentecost & Garcia, 2006; Armbruster, 2011).

11.2 Написание исследовательского отчета в стиле Американской психологической ассоциации (АПА)

ЦЕЛИ ОБУЧЕНИЯ

Определите основные разделы исследовательского отчета в стиле APA и основное содержание каждого раздела.

Спланируйте и напишите эффективный исследовательский отчет в стиле APA.

В этом разделе мы рассмотрим, как написать отчет об эмпирическом исследовании в стиле APA , статью, в которой представлены результаты одного или нескольких новых исследований. Напомним, что стандартные разделы отчета об эмпирическом исследовании представляют собой своего рода план. Здесь мы подробно рассмотрим каждый из этих разделов, включая информацию, которую он содержит, форматирование и организацию этой информации, а также советы по написанию каждого раздела. В конце этого раздела приведен образец исследовательского отчета в стиле APA, который иллюстрирует многие из этих принципов.


Разделы исследовательского отчета

Титульный лист и Аннотация

Отчет об исследовании в стиле APA начинается с титульного листа . Заголовок размещается по центру в верхней половине страницы, каждое важное слово пишется с заглавной буквы. Название должно быть четким и кратким (примерно в 12 словах или менее) для передачи основных переменных и вопросов исследования. Иногда для этого требуется основной заголовок, за которым следует подзаголовок, который уточняет основной заголовок, и в этом случае основной заголовок и подзаголовок разделяются двоеточием. Вот несколько заголовков из последних выпусков профессиональных журналов, издаваемых Американской психологической ассоциацией.


Половые различия в стилях совладания и влияние на депрессивное настроение

Влияние старения и разделения внимания на запоминание предметов и их контекстов

Компьютерная когнитивно-поведенческая терапия детской тревожности: результаты рандомизированного клинического исследования

Виртуальное вождение и принятие риска: улучшают ли гоночные игры познание, влияние и поведение, связанные с принятием риска?

Под заголовком указаны имена авторов и, на следующей строке, их институциональная принадлежность — университет или другое учреждение, в котором работали авторы, когда они проводили исследование. Как мы уже видели, авторы перечислены в порядке, отражающем их вклад в исследование. Когда несколько авторов внесли равный вклад в исследование, они часто перечисляют свои имена в алфавитном порядке или в произвольном порядке.


Это оооочень мило!

Насколько неформальным должно быть название статьи?


В некоторых областях психологии заголовки многих отчетов об эмпирических исследованиях носят неформальный характер и, возможно, их лучше всего описать как «милые». Обычно они имеют форму игры слов или известного выражения, относящегося к изучаемой теме. Вот несколько примеров из последних выпусков Журнала личности и социальной психологии .


«Давайте серьезно: передача обязательств в романтических отношениях»

«Ясно в Зазеркалье: точность и предполагаемое сходство в первых впечатлениях хорошо приспособленных людей»

«Не прячь свое счастье! Диссоциация позитивных эмоций, социальная связанность и психологическое функционирование».

«Запретный плод: невнимание к привлекательным альтернативам провоцирует имплицитную реактивность отношений»

Отдельные исследователи немного различаются в своих предпочтениях в отношении таких названий. Кто-то использует их регулярно, а кто-то никогда. Каковы могут быть плюсы и минусы использования милых названий статей?


Для статей, которые представляются для публикации, на титульном листе также есть примечание автора, в котором указывается полная институциональная принадлежность авторов, любые признания, которые авторы желают выразить агентствам, финансировавшим исследование, или коллегам, которые прокомментировали его, и контактная информация. для авторов. Для студенческих работ, которые не представляются для публикации, включая тезисы, примечания автора, как правило, не требуются.


Аннотация представляет собой краткое изложение исследования . Это вторая страница рукописи и озаглавлена ​​словом « Аннотация » . Первая строка не имеет отступа. В аннотации представлены исследовательский вопрос, краткое изложение метода, основные результаты и наиболее важные выводы. Поскольку аннотация обычно ограничивается примерно 200 словами, написать хорошую аннотацию может быть непросто.


Введение

Введение начинается на третьей странице рукописи. Заголовок в верхней части этой страницы представляет собой полное название рукописи, где каждое важное слово пишется с заглавной буквы, как на титульном листе. Введение включает три отдельных подраздела, хотя обычно они не обозначаются отдельными заголовками. В начале вводится вопрос исследования и объясняется, почему он интересен, в обзоре литературы обсуждаются соответствующие предыдущие исследования, а в заключении вновь формулируется вопрос исследования и комментируется метод, использованный для ответа на него.


Открытие

Вступление , которое обычно состоит из одного или двух абзацев, вводит вопрос исследования и объясняет, чем он интересен. Чтобы привлечь внимание читателя, исследователь Дэрил Бем рекомендует начинать с общих наблюдений по изучаемой теме, выраженных обычным языком (не техническим жаргоном) — наблюдений, которые касаются людей и их поведения (а не исследователей или их исследований; Bem, 2003). . Бем, ди-джей (2003). Написание статьи для эмпирического журнала. В книге Дж. М. Дарли, члена парламента Занна и Х. Р. Редигера III (редакторы), «Совершенный академик: практическое руководство для начинающих социологов » (2-е изд.). Вашингтон, округ Колумбия: Американская психологическая ассоциация.Здесь часто очень полезны конкретные примеры. По словам Бема, это было бы плохим началом исследовательского отчета:


Теория когнитивного диссонанса Фестингера привлекла большое внимание во второй половине 20-го века (стр. 191).


Следующее будет намного лучше:


Человек, который придерживается двух убеждений, несовместимых друг с другом, может чувствовать себя некомфортно. Например, человек, который знает, что ему или ей нравится курить, но считает, что это вредно для здоровья, может испытывать дискомфорт, возникающий из-за несоответствия или дисгармонии между этими двумя мыслями или представлениями. Это чувство дискомфорта было названо когнитивным диссонансом социальным психологом Леоном Фестингером (1957), который предположил, что люди будут мотивированы устранять этот диссонанс любым возможным способом (стр. 191).


После привлечения внимания читателя в начале следует представить вопрос исследования и объяснить, почему он интересен. Заполнит ли ответ пробел в литературе? Будет ли это проверкой важной теории? Имеет ли это практическое значение? Предоставление читателям ясного представления о том, о чем идет речь в исследовании и почему они должны о нем заботиться, будет мотивировать их продолжать чтение обзора литературы и поможет им разобраться в нем.


Нарушение правил

Исследователь Ларри Джейкоби сообщил о нескольких исследованиях, показывающих, что слово, которое люди видят или слышат неоднократно, может показаться более знакомым, даже если они не помнят повторений, и что эта тенденция особенно заметна среди пожилых людей. Он открыл свою статью следующим юмористическим анекдотом (Jacoby, 1999).


Подруга, чья мать страдает от болезни Альцгеймера (БА), рассказывает историю о том, как отвезла свою мать в дом престарелых до ее переезда туда. Во время ознакомительного собрания в доме престарелых были разъяснены правила и положения, одно из которых касалось столовой. Столовая была описана как похожая на прекрасный ресторан, за исключением того, что чаевые не требовались. Отсутствие чаевых было центральной темой вводной лекции, которую часто упоминали, чтобы подчеркнуть качество обслуживания наряду с преимуществами предварительной оплаты. В конце встречи у матери друга спросили, есть ли у нее вопросы. Она ответила, что у нее есть только один вопрос: «Должен ли я давать чаевые?» (стр. 3).


Хотя и юмор, и личные анекдоты, как правило, не приветствуются в стиле APA, этот пример является очень эффективным способом начать, потому что он одновременно привлекает читателя и представляет собой отличный реальный пример изучаемой темы.


Обзор литературы

Сразу после открытия следует обзор литературы , в котором описываются актуальные предыдущие исследования по теме и который может занимать от нескольких абзацев до нескольких страниц. Однако обзор литературы — это не просто список прошлых исследований. Наоборот, это своего рода аргумент в пользу того, почему вопрос исследования заслуживает внимания. К концу обзора литературы читатели должны быть убеждены, что вопрос исследования имеет смысл и что настоящее исследование является логическим следующим шагом в продолжающемся исследовательском процессе.


Как и любая эффективная аргументация, обзор литературы должен иметь определенную структуру. Например, он может начать с общего описания явления вместе с несколькими исследованиями, которые его демонстрируют, затем описать две или более конкурирующих теории явления и, наконец, представить гипотезу для проверки одной или нескольких теорий. Или он может описывать одно явление, затем описывать другое явление, которое кажется несовместимым с первым, затем предлагать теорию, разрешающую противоречие, и, наконец, выдвигать гипотезу для проверки этой теории. В прикладных исследованиях это может быть описание явления или теории, затем описание того, как это явление или теория применимы к какой-либо важной ситуации в реальном мире, и, наконец, предложение способа проверить, действительно ли они применимы к этой ситуации.


Глядя на обзор литературы таким образом, можно сделать акцент на нескольких вещах. Во-первых, чрезвычайно важно начать с наброска основных моментов, которые вы хотите сделать, организованных в том порядке, в котором вы хотите их изложить. Таким образом, основная структура вашего аргумента должна быть очевидна из самого плана. Во-вторых, важно подчеркнуть структуру вашего аргумента в письме. Один из способов сделать это — начать обзор литературы с обобщения ваших аргументов еще до того, как вы начнете их излагать. «В этой статье я опишу два явно противоречащих друг другу явления, представлю новую теорию, способную разрешить кажущееся противоречие, и, наконец, представлю новую гипотезу для проверки теории. Другой способ — открывать каждый абзац предложением, которое резюмирует основную мысль абзаца и связывает ее с предыдущими пунктами. Эти начальные предложения обеспечивают «переходы», с которыми у многих начинающих исследователей возникают трудности. Вместо того, чтобы начинать абзац с описания предыдущего исследования, такого как «Уильямс (2004) обнаружил, что…», лучше начать с указания на то, почему вы описываете это конкретное исследование. Вот несколько простых примеров:


Другой пример этого явления взят из работы Уильямса (2004).


Уильямс (2004) предлагает одно объяснение этого явления.


Альтернативную точку зрения предложил Уильямс (2004).


Мы использовали метод, основанный на методе, использованном Уильямсом (2004).


Наконец, помните, что ваша цель состоит в том, чтобы аргументировать, почему ваш исследовательский вопрос интересен и заслуживает внимания, а не обязательно, почему ваш любимый ответ на него правильный. Другими словами, ваш обзор литературы должен быть сбалансированным. Если вы хотите подчеркнуть общность явления, то, конечно, следует обсудить различные исследования, которые его продемонстрировали. Однако, если есть другие исследования, которые не смогли это продемонстрировать, вам следует обсудить и их. Или, если вы предлагаете новую теорию, то, конечно, вы должны обсудить результаты, которые согласуются с этой теорией. Однако, если есть другие выводы, которые не согласуются с ним, опять же, вам следует обсудить и их. Можно утверждать, что балансисследования подтверждают существование феномена или согласуются с теорией (и это обычно лучшее, на что могут надеяться исследователи в области психологии), но недопустимо игнорировать противоречивые данные. Кроме того, большая часть того, что делает исследовательский вопрос интересным, — это неопределенность ответа на него.


Закрытие

Завершение введения — обычно последний абзац или два — обычно включает два важных элемента . Во-первых, это четкая постановка основного исследовательского вопроса или гипотезы. Это утверждение имеет тенденцию быть более формальным и точным, чем в начале, и часто выражается в терминах операционных определений ключевых переменных. Второй представляет собой краткий обзор метода и некоторые комментарии относительно его целесообразности. Вот, например, как Darley and Latané (1968) Darley, JM, & Latané, B. (1968). Вмешательство свидетелей в чрезвычайных ситуациях: Распределение ответственности. Журнал личности и социальной психологии, 4 , 377–383. заключили введение к своей классической статье об эффекте свидетеля:


Эти соображения приводят к гипотезе о том, что чем больше свидетелей в чрезвычайной ситуации, тем меньше вероятность или тем медленнее любой из свидетелей вмешается, чтобы оказать помощь. Чтобы проверить это предположение, было бы необходимо создать ситуацию, в которой могла бы возникнуть реальная «чрезвычайная ситуация». Каждому субъекту также следует заблокировать общение с другими, чтобы предотвратить получение им информации об их поведении во время чрезвычайной ситуации. Наконец, экспериментальная ситуация должна позволять оценить скорость и частоту реакции испытуемых на нештатную ситуацию. Эксперимент, описанный ниже, пытался выполнить эти условия (стр. 378).


Таким образом, введение плавно переходит в следующий крупный раздел статьи — раздел о методах.


Метод

В разделе « Метод» вы описываете, как вы проводили свое исследование. Важным принципом написания раздела метода является то, что он должен быть четким и достаточно подробным, чтобы другие исследователи могли повторить исследование, следуя вашему «рецепту». Это означает, что он должен описывать все важные элементы исследования — основные демографические характеристики участников, то, как они были набраны, были ли они распределены случайным образом, как переменные манипулировались или измерялись, как осуществлялось уравновешивание и так далее. В то же время следует избегать не относящихся к делу подробностей, таких как тот факт, что исследование проводилось в классе 37В Промышленно-технологического корпуса или что анкета была двусторонней и заполнялась карандашом.


Раздел «Метод» начинается сразу после того, как введение заканчивается заголовком «Метод» (не «Методы») по центру страницы. Сразу после этого идет подзаголовок «Участники», оставленный по ширине и выделенный курсивом. В подразделе «Участники» указывается количество участников, количество женщин и мужчин, некоторые указания на их возраст, другие демографические данные, которые могут иметь отношение к исследованию, и способ их набора, включая любые поощрения за участие.


Рис. 11.1 . Три способа организации метода в стиле АРА



После раздела участников структура может немного измениться. На рис. 11.1 «Три способа организации метода в стиле APA» показаны три общих подхода. В первом разделе участников следует подраздел дизайна и процедуры, в котором описывается остальная часть метода. Это хорошо работает для методов, которые относительно просты и могут быть адекватно описаны в нескольких абзацах. Во втором подходе за разделом участников следуют отдельные подразделы дизайна и процедуры. Это хорошо работает, когда и дизайн, и процедура относительно сложны, и каждый из них требует нескольких абзацев.


В чем разница между дизайном и процедурой? Дизайн исследования – это его общая структура. Каковы были независимые и зависимые переменные? Манипулировали ли независимой переменной, и если да, то манипулировали ли ею между субъектами или внутри них? Как переменные были оперативно определены? Процедура – ​​это то, как проводилось исследование. Часто хорошо описывать процедуру с точки зрения того, что делали участники, а не того, что делали исследователи. Например, участники дали свое информированное согласие, прочитали набор инструкций, завершили блок из четырех практических испытаний, завершили блок из 20 тестовых испытаний, заполнили две анкеты, были проинструктированы и освобождены.


В третьем базовом способе организации раздела метода за подразделом участников следует подраздел материалов перед подразделами дизайна и процедуры. Это хорошо работает, когда есть сложные материалы для описания. Это может означать несколько анкет, письменные виньетки, которые участники читают и на которые отвечают, перцептивные стимулы и так далее. Заголовок этого подраздела можно изменить, чтобы отразить его содержание. Вместо «Материалов» это могут быть «Опросники», «Стимулы» и так далее.


Полученные результаты

В разделе результатов вы представляете основные результаты исследования, включая результаты статистического анализа. Хотя он не включает необработанные данные — ответы или баллы отдельных участников, — исследователи должны сохранять свои необработанные данные и предоставлять их другим исследователям, которые запрашивают их. Некоторые журналы теперь размещают необработанные данные в Интернете.


Хотя стандартных подразделов нет, важно, чтобы раздел результатов был логически организован. Обычно он начинается с некоторых предварительных вопросов. Во-первых, были ли какие-либо участники или ответы исключены из анализа и почему. Обоснование исключения данных должно быть четко описано, чтобы другие исследователи могли решить, уместно ли оно. Второй предварительный вопрос заключается в том, как несколько ответов были объединены для получения основных переменных в анализе. Например, если участники оценили привлекательность 20 стимулирующих людей, вам, возможно, придется объяснить, что вы начали с вычисления среднего рейтинга привлекательности для каждого участника. Или, если они вспомнили столько элементов, сколько смогли, из учебного списка из 20 слов, подсчитали ли вы число правильно воспроизведенных, подсчитали процент правильно воспроизведенных, или, возможно, вычислить правильное число минус неправильное число? Третьим предварительным вопросом является надежность мер. Здесь вы должны представить корреляции между тестами и повторными тестами, α Кронбаха или другие статистические данные, чтобы показать, что меры согласуются во времени и между элементами. Последний предварительный вопрос заключается в том, была ли манипуляция успешной. Здесь вы должны сообщать о результатах любых проверок манипуляций.


Раздел результатов должен затем решать основные вопросы исследования, один за другим. Опять же, должна быть четкая организация. Один из подходов состоит в том, чтобы отвечать на самые общие вопросы, а затем переходить к ответам на более конкретные. Другой вариант — сначала ответить на главный вопрос, а затем — на второстепенные. Тем не менее, Бем (2003) Бем, ди-джей (2003). Написание статьи для эмпирического журнала. В книге Дж. М. Дарли, члена парламента Занна и Х. Р. Редигера III (редакторы), «Совершенный академик: практическое руководство для начинающих социологов » (2-е изд.). Вашингтон, округ Колумбия: Американская психологическая ассоциация. предлагает следующую базовую структуру для обсуждения каждого нового результата:


Напомните читателю исследовательский вопрос.

Дайте ответ на исследовательский вопрос словами.

Представить соответствующую статистику.

Если необходимо, уточните ответ.

Подведите итоги.

Обратите внимание, что только шаг 3 обязательно включает числа. Остальные шаги включают словесное изложение вопроса исследования и ответа на него. На самом деле основные результаты должны быть понятны даже тому читателю, который пропускает цифры.


Обсуждение

Обсуждение является последним крупным разделом исследовательского отчета. Обсуждения обычно состоят из некоторой комбинации следующих элементов:


Резюме исследования

Теоретические выводы

Практические последствия

Ограничения

Предложения для будущих исследований

Обсуждение обычно начинается с краткого изложения исследования, которое дает четкий ответ на вопрос исследования. В коротком отчете с одним исследованием для этого может потребоваться не более одного предложения. В более длинном отчете с несколькими исследованиями может потребоваться один абзац или даже два. Резюме часто сопровождается обсуждением теоретических последствий исследования. Поддерживают ли результаты какие-либо существующие теории? Если нет, то как можноих объяснить? Хотя вам не нужно давать окончательное объяснение или подробную теорию ваших результатов, вам, по крайней мере, необходимо обрисовать одно или несколько возможных объяснений. В прикладных исследованиях — и часто в фундаментальных исследованиях — также обсуждаются практические последствия исследования. Как и кем могут быть использованы результаты для достижения какой-то реальной цели?


За теоретическими и практическими выводами часто следует обсуждение ограничений исследования. Возможно, есть проблемы с его внутренней или внешней валидностью. Возможно, манипуляция была не очень эффективной или меры не очень надежными. Возможно, есть некоторые свидетельства того, что участники не до конца понимали свою задачу или что они с подозрением относились к намерениям исследователей. Настало время обсудить эти вопросы и то, как они могли повлиять на результаты. Но не переусердствуйте. Все исследования имеют ограничения, и большинство читателей поймут, что другая выборка или другие меры могли дать другие результаты. Если нет веских оснований полагать, что ониОднако нет причин упоминать об этих рутинных проблемах. Вместо этого выберите два-три ограничения, которые, как кажется, могли повлиять на результаты, объясните, как они могли повлиять на результаты, и предложите способы их устранения.


Большинство дискуссий заканчиваются некоторыми предложениями для будущих исследований. Если исследование не дало удовлетворительного ответа на первоначальный исследовательский вопрос, что для этого потребуется? Какие новые исследовательские вопросы подняло исследование? Эта часть обсуждения, однако, представляет собой не просто список новых вопросов. Это обсуждение двух-трех наиболее важных нерешенных вопросов. Это означает выявление и уточнение каждого вопроса, предложение некоторых альтернативных ответов и даже предложение способов их изучения.


Наконец, некоторые исследователи неплохо заканчивают свои статьи широким или наводящим на размышления выводом. Дарли и Латане (1968), Дарли, Дж. М., и Латане, Б. (1968). Вмешательство свидетелей в чрезвычайных ситуациях: Распределение ответственности. Журнал личности и социальной психологии, 4 , 377–383.например, закончили свою статью об эффекте наблюдателя обсуждением идеи о том, что помощь людей другим может зависеть больше от ситуации, чем от их личности. Их последнее предложение звучит так: «Если люди осознают ситуационные силы, которые могут заставить их колебаться перед вмешательством, они смогут лучше их преодолеть» (стр. 383). Тем не менее, такой конец может быть трудно осуществить. Это может звучать преувеличенно или просто банально и в конечном итоге умаляет общее влияние статьи. Часто лучше просто закончить, когда вы сделали свою последнюю точку (хотя вам следует избегать окончания на ограничении).


использованная литература

Раздел ссылок начинается на новой странице с заголовком «Ссылки», расположенным по центру вверху страницы. Все ссылки, цитируемые в тексте, затем перечислены в представленном ранее формате. Они перечислены в алфавитном порядке по фамилии первого автора. Если у двух источников один и тот же первый автор, они перечислены в алфавитном порядке по фамилии второго автора. Если все авторы одни и те же, то они перечислены в хронологическом порядке по году издания. Все элементы в списке литературы разделены двойным интервалом как внутри, так и между ссылками.


Приложения, таблицы и рисунки

Приложения, таблицы и рисунки идут после списка литературы. Приложение подходит для дополнительного материала, который прервал бы поток исследовательского отчета, если бы он был представлен в любом из основных разделов. Приложение может быть использовано для представления списков стимулирующих слов, пунктов анкеты, подробных описаний специального оборудования или необычных статистических анализов или ссылок на исследования, включенные в метаанализ. Каждое приложение начинается с новой страницы. Если есть только один, заголовок «Приложение» располагается по центру вверху страницы. Если их несколько, то заголовки «Приложение А», «Приложение Б» и т. д. появляются в том порядке, в котором они были впервые упомянуты в тексте отчета.


После любых приложений идут таблицы, а затем рисунки. Таблицы и рисунки используются для представления результатов. Рисунки также можно использовать для иллюстрации теорий (например, в виде блок-схем), отображения стимулов, описания процедур и представления многих других видов информации. Каждая таблица и рисунок отображаются на отдельной странице. Таблицы нумеруются в порядке их первого упоминания в тексте («Таблица 1», «Таблица 2» и т. д.). Рисунки нумеруются одинаково («Рисунок 1», «Рисунок 2» и т. д.). Над каждой таблицей появляется краткое пояснительное заглавие, в котором важные слова выделены заглавными буквами. Каждый рисунок снабжен краткой пояснительной подписью, где (кроме имен собственных или имён) только первое слово каждого предложения пишется с заглавной буквы. Более подробная информация о подготовке таблиц и рисунков в стиле APA представлена ​​далее в книге.


Образец отчета об исследовании в стиле APA

На рис. 11.2 «Титульный лист и аннотация» , рис. 11.3 «Введение и метод» , рис. 11.4 «Результаты и обсуждение» и рис. 11.5 «Ссылки и рисунок» показаны некоторые примеры страниц из отчета об эмпирическом исследовании в стиле APA, первоначально написанного студентом бакалавриата. Томоэ Суяма в Калифорнийском государственном университете во Фресно. Основная цель этих рисунков — проиллюстрировать базовую организацию и форматирование отчета об эмпирическом исследовании в стиле APA, хотя здесь также можно увидеть множество условностей стиля высокого и низкого уровня.


Рисунок 11.2 Титульная страница и аннотация



Эта студенческая работа не включает примечание автора на титульном листе. Аннотация размещается на отдельной странице.


Рисунок 11.3 Введение и метод



Обратите внимание, что введение начинается с полного названия, а раздел методов начинается сразу после окончания введения.


Рисунок 11.4 Результаты и обсуждение



Обсуждение начинается сразу после окончания раздела результатов.


Рисунок 11.5 Ссылки и рисунок



Если бы были приложения или таблицы, они стояли бы перед рисунком.


КЛЮЧЕВЫЕ ВЫВОДЫ

Отчет об эмпирическом исследовании в стиле APA состоит из нескольких стандартных разделов. Основными из них являются аннотация, введение, метод, результаты, обсуждение и список литературы.

Введение состоит из открытия, в котором представлен вопрос исследования, обзора литературы, в котором описываются предыдущие исследования по теме, и закрытия, в котором повторно формулируется вопрос исследования и комментарии к методу. Обзор литературы представляет собой аргумент в пользу того, почему настоящее исследование стоит провести.

Раздел метода описывает метод достаточно подробно, чтобы другой исследователь мог повторить исследование. Как минимум, он состоит из подраздела участников и подраздела дизайна и процедур.

Раздел результатов описывает результаты в упорядоченном виде. Каждый первичный результат представлен в виде статистических результатов, но также объяснен словами.

В ходе обсуждения обычно подводятся итоги исследования, обсуждаются теоретические и практические последствия и ограничения исследования, а также предлагаются предложения для дальнейших исследований.

УПРАЖНЕНИЯ

Практика: Просмотрите выпуск профессионального журнала общего интереса (например, Psychological Science ). Прочитайте начало первых пяти статей и оцените эффективность каждой из них от 1 ( очень неэффективно ) до 5 ( очень эффективно ). Напишите одно или два предложения, объясняющие каждую оценку.

Попрактикуйтесь: найдите недавнюю статью в профессиональном журнале и определите, где начинается и заканчивается введение, обзор литературы и завершение.

Практика: Найдите недавнюю статью в профессиональном журнале и выделите другим цветом каждый из следующих элементов обсуждения: резюме, теоретические выводы, практические выводы, ограничения и предложения для будущих исследований.

11.3 Другие форматы презентации

ЦЕЛИ ОБУЧЕНИЯ

Перечислите несколько способов, которыми исследователи в области психологии могут представить свои исследования, и ситуации, в которых они могут их использовать.

Опишите, чем окончательные рукописи отличаются от копий рукописей в стиле Американской психологической ассоциации (АПА).

Опишите цель выступлений и постеров на профессиональных конференциях.

Подготовьте короткий доклад в стиле конференции и простую постерную презентацию.

Написание отчета об эмпирическом исследовании в стиле Американской психологической ассоциации (АПА) — это только один из способов представить новое исследование в области психологии. В этом разделе мы рассмотрим несколько других важных способов.


Другие типы рукописей

Раздел 11.2 «Написание отчета об исследовании в стиле Американской психологической ассоциации (АПА)» посвящен написанию отчетов об эмпирических исследованиях, которые должны быть представлены для публикации в профессиональном журнале. Однако есть и другие виды рукописей, написанных в стиле АРА, многие из которых не будут представлены для публикации где-либо еще. Здесь мы рассмотрим некоторые из них.


Обзорные и теоретические статьи

Напомним, что обзорные статьи обобщают исследования по определенной теме, не представляя новых эмпирических результатов. Когда в этих статьях представлена ​​новая теория, их часто называют теоретическими статьями .. Обзорные и теоретические статьи структурированы так же, как отчеты об эмпирических исследованиях, с титульным листом, аннотацией, ссылками, приложениями, таблицами и рисунками, и они написаны в одном и том же стиле высокого и низкого уровня. Однако, поскольку они не сообщают о результатах новых эмпирических исследований, в них нет раздела методов или результатов. Конечно, основная часть рукописи должна по-прежнему иметь логическую организацию и включать начало, в котором определяется тема и объясняется ее важность, обзор литературы, в котором систематизированы предыдущие исследования (определение важных взаимосвязей между концепциями или пробелами в литературе), и заключительная часть. или вывод, который обобщает основные выводы и предлагает направления для дальнейших исследований или обсуждает теоретические и практические последствия. В теоретической статье, конечно, большая часть текста рукописи посвящена представлению новой теории. Теоретические и обзорные статьи обычно делятся на разделы, каждый из которых имеет заголовок, соответствующий этому разделу. Разделы и заголовки могут значительно различаться от статьи к статье (в отличие от отчета об эмпирическом исследовании). Но какими бы они ни были, они должны помочь организовать рукопись и прояснить аргументацию.


Заключительные рукописи

До сих пор мы занимались форматированием рукописей, которые будут отправлены в профессиональный журнал для публикации. Они упоминаются как копии рукописей . Многие особенности копии рукописи — постоянный двойной интервал, бегущая строка и размещение таблиц и рисунков в конце — предназначены для облегчения редактирования и верстки на пути к публикации. Опубликованная журнальная статья сильно отличается от копии рукописи. Например, название и информация об авторе, аннотация и начало введения обычно располагаются на одной странице, а не на разных страницах. Напротив, другие типы рукописей готовятся автором в их окончательном виде без намерения представить их для публикации в другом месте. Это так называемые окончательные рукописи .и включают диссертации, тезисы и другие студенческие работы.


Окончательные рукописи могут отличаться от копий во многих отношениях, что облегчает их чтение. Это может включать в себя расположение таблиц и рисунков рядом с тем местом, где они обсуждаются, чтобы читателю не приходилось перелистывать рукопись, чтобы увидеть их. Он также может включать изменения межстрочного интервала, которые улучшают читабельность, например, использование одинарного интервала для заголовков таблиц и рисунков или тройного интервала между основными разделами или вокруг таблиц и рисунков. Диссертации и тезисы могут отличаться от копий рукописи дополнительными признаками. У них может быть более длинная аннотация, специальная страница благодарностей, оглавление и так далее. Что касается студенческих работ, важно уточнить у преподавателя курса особенности форматирования. В курсе методов исследования,


Презентации конференции

Один из способов, которым исследователи в области психологии делятся своими исследованиями друг с другом, — это представление их на профессиональных конференциях .. (Хотя некоторые профессиональные конференции по психологии посвящены главным образом вопросам клинической практики, нас здесь интересуют те, которые сосредоточены на исследованиях.) Профессиональные конференции могут варьироваться от небольших мероприятий с участием дюжины исследователей, которые собираются вместе после обеда, до крупных. масштабные мероприятия с участием тысяч исследователей, которые встречаются в течение нескольких дней. Хотя исследователи, посещающие профессиональные конференции, скорее всего, обсуждают друг с другом свою работу в неформальной обстановке, есть еще два формальных типа презентации: устные презентации («доклады») и постеры.


Профессиональные конференции

Ниже приведены ссылки на веб-сайты нескольких крупных национальных конференций в США, а также нескольких конференций, на которых представлены работы студентов бакалавриата. Полный список психологических конференций по всему миру см. на следующем веб-сайте.


 


Крупные национальные конференции


Конвенция Американской психологической ассоциации: http://www.apa.org/convention


Конференция Ассоциации психологических наук: http://www.psychologicalscience.org/index.php/convention


Конференция Общества личности и социальной психологии: http://www.spsp.org/confer.htm


Ежегодное собрание Психономического общества: http://www.psychonomic.org/annual-meeting.html


Студенческие конференции


Конференция по психологии Каролины: http://www.meredith.edu/psych/cpc/default.htm


Конференция по психологии бакалавриата в Иллове: http://homepages.culver.edu/illowa


Л. Старлинг Рид Конференция по психологии бакалавриата (Университет Вирджинии): http://www.virginia.edu/psychology/conference


Научная конференция студентов-психологов (UCLA): http://purc.psych.ucla.edu


Конференция по исследованиям в области психологии для студентов Средней Америки: http://castle.eiu.edu/psych/mauprc


Стэнфордская психологическая конференция студентов: http://www.stanfordconference.org


Конференция по психологии бакалавриата Западной Пенсильвании: http://webpub.allegheny.edu/group/wpuc/WPUPweb_page/WPUPC.htm


Конференция по западной психологии для студентов бакалавриата: http://www.stmarys-ca.edu/psychology/the-western-psychology-conference-for-undergraduate-research-wpcur


Устные доклады

В устной презентации , или «разговоре», докладчик стоит перед аудиторией других исследователей и рассказывает им о своем исследовании — обычно с помощью слайд-шоу. Выступления обычно длятся от 10 до 20 минут, причем последние несколько минут отводятся на вопросы аудитории. На более крупных конференциях доклады обычно группируются в сеансы продолжительностью час или два, на которых все доклады посвящены одной и той же общей теме.


При подготовке доклада докладчики должны помнить о нескольких общих принципах. Во-первых, количество слайдов должно быть не более одного в минуту выступления. Во-вторых, доклад обычно структурирован как исследовательский отчет в стиле APA. Есть слайд с заголовком и авторами, несколько слайдов для общего представления, еще несколько для описания метода, несколько для результатов и несколько для выводов. В-третьих, выступающий должен смотреть на зрителей и говорить с ними в разговорном тоне, менее формальном, чем в стиле АПА, но более формальном, чем разговор с другом. Слайды не должны быть в центре внимания презентации; они должны выступать в качестве наглядных пособий. Таким образом, они должны представлять основные моменты в виде маркированных списков или простых таблиц и рисунков.


Плакаты

Еще один способ представить исследование на конференции — это постер . Постер обычно представляется во время одно-двухчасовой постерной сессии .это происходит в большой комнате на месте проведения конференции. Ведущие размещают свои плакаты на досках объявлений, расставленных по комнате, и встают рядом с ними. Затем другие исследователи ходят по комнате, читают плакаты и разговаривают с докладчиками. По сути, постерные сессии — это взрослая версия школьной научной ярмарки. Но ничего детского в них нет. Плакаты используются профессиональными исследователями во всех научных дисциплинах и становятся все более распространенными. На недавней конференции Американского психологического общества было представлено около 2000 плакатов на 16 отдельных стендовых сессиях. Одна из причин, по которой плакаты так популярны, заключается в том, что они способствуют содержательному взаимодействию между исследователями.


Рисунок 11.6



Новые исследования часто представляются в виде постеров на профессиональных конференциях.


Источник: фото любезно предоставлено научной медиалабораторией McMaster University.


Хотя плакат может состоять из нескольких листов бумаги, прикрепленных отдельно к доске объявлений, в настоящее время чаще всего они состоят из одного большого листа бумаги. В любом случае информация организована в отдельные разделы, включая название, имена и связи авторов, введение, раздел методов, раздел результатов, раздел обсуждения или выводов, ссылки и благодарности. Хотя плакаты могут включать аннотацию, в этом может не быть необходимости, поскольку сам плакат уже является кратким изложением исследования. На рис. 11.7 «Два возможных способа организации информации на плакате» показаны два различных способа организации информации на плакате.


Рис. 11.7 Два возможных способа организации информации на плакате



Учитывая условия, в которых часто демонстрируются плакаты — например, в переполненных бальных залах, где люди также едят, пьют и общаются, — они должны быть построены так, чтобы представлять основные идеи, лежащие в основе исследования, в максимально простой и ясной форме. . Размер шрифта на афише должен быть крупным — возможно, 72 пункта для названия и фамилий авторов и 28 пунктов для основного текста. Информация должна быть разбита на разделы с четкими заголовками, а текст должен состоять из предложений или маркированных пунктов, а не абзацев. Также лучше, чтобы он был организован в столбцы и шел сверху вниз, а не в ряды, которые проходили через плакат. Это позволяет нескольким людям читать одновременно, не натыкаясь друг на друга. Плакаты часто включают элементы, которые добавляют визуальный интерес. Рисунки могут быть более красочными, чем в рукописи в стиле APA. Плакаты также могут включать копии визуальных стимулов, фотографии аппарата или симуляцию тестируемых участников. Они также могут включать чисто декоративные элементы, хотя с ними лучше не перебарщивать.


Опять же, основная причина того, что плакаты становятся таким популярным способом представления исследований, заключается в том, что они облегчают взаимодействие между исследователями. Многие ведущие сразу же предлагают рассказать посетителям о своем исследовании и использовать плакат в качестве наглядного пособия. По крайней мере, докладчикам важно стоять у своих плакатов, приветствовать посетителей, предлагать ответы на вопросы и быть готовым к вопросам и даже случайным критическим комментариям. Как правило, неплохо иметь более подробный отчет об исследовании, доступный для посетителей, которым нужна дополнительная информация, предложить отправить им подробный отчет или предоставить контактную информацию, чтобы они могли запросить дополнительную информацию позже.


Для получения дополнительной информации о подготовке и представлении докладов и постеров посетите веб-сайт Psi Chi, Международного общества чести в области психологии: http://www.psichi.org/conventions/tips.aspx .


КЛЮЧЕВЫЕ ВЫВОДЫ

Исследования в области психологии могут быть представлены в нескольких различных форматах. В дополнение к отчетам об эмпирических исследованиях в стиле APA есть теоретические и обзорные статьи; окончательные рукописи, включая диссертации, тезисы и студенческие работы; выступления и постеры на профессиональных конференциях.

Доклады и постеры на профессиональных конференциях следуют некоторым правилам стиля APA, но значительно менее подробны, чем исследовательские отчеты в стиле APA. Их функция состоит в том, чтобы представлять новые исследования заинтересованным исследователям и способствовать дальнейшему взаимодействию между исследователями.

УПРАЖНЕНИЕ

Обсуждение: выполните поиск в Интернете, используя поисковые запросы, такие как психология и плакат , чтобы найти три примера плакатов, которые были представлены на конференциях. Основываясь на информации, содержащейся в этой главе, каковы основные сильные и слабые стороны каждого плаката?





Описательная статистика

На этом этапе нам необходимо более подробно рассмотреть основы анализа данных в психологических исследованиях. В этой главе мы сосредоточимся на описательной статистике — наборе методов для обобщения и отображения данных из вашей выборки. Сначала мы рассмотрим некоторые из наиболее распространенных методов описания отдельных переменных, а затем некоторые из наиболее распространенных методов описания статистических взаимосвязей между переменными. Затем мы рассмотрим, как представить описательную статистику в письменной форме, а также в виде таблиц и графиков, которые подходят для исследовательского отчета в стиле Американской психологической ассоциации (АПА). Мы заканчиваем некоторыми практическими советами по организации и проведению ваших анализов.


12.1 Описание отдельных переменных

ЦЕЛИ ОБУЧЕНИЯ

Используйте частотные таблицы и гистограммы для отображения и интерпретации распределения переменной.

Вычислите и интерпретируйте среднее значение, медиану и моду распределения и определите ситуации, в которых среднее значение, медиана или мода являются наиболее подходящей мерой центральной тенденции.

Вычислите и интерпретируйте диапазон и стандартное отклонение распределения.

Вычислите и интерпретируйте процентные ранги и z - оценки.

Описательная статистика относится к набору методов обобщения и отображения данных. Предположим здесь, что данные количественные и состоят из баллов по одной или нескольким переменным для каждого из нескольких участников исследования. Хотя в большинстве случаев основной исследовательский вопрос будет касаться одной или нескольких статистических взаимосвязей между переменными, также важно описать каждую переменную в отдельности. По этой причине мы начнем с рассмотрения некоторых наиболее распространенных методов описания одиночных переменных.


Распределение переменной

Каждая переменная имеет распределение , то есть то, как баллы распределяются по уровням этой переменной. Например, в выборке из 100 студентов колледжа распределение переменной «количество братьев и сестер» может быть таким, что 10 из них не имеют братьев и сестер, 30 имеют одного брата и сестру, 40 имеют двух братьев и сестер и так далее. В той же выборке распределение переменной «пол» может быть таким, что 44 человека имеют оценку «мужской», а 56 — «женский».


Таблицы частот

Одним из способов отображения распределения переменной является таблица частот . Таблица 12.1 «Таблица частот, показывающая гипотетическое распределение баллов по шкале самооценки Розенберга», например, представляет собой таблицу частот, показывающую гипотетическое распределение баллов по шкале самооценки Розенберга для выборки из 40 студентов колледжа. В первом столбце перечислены значения переменной — возможные баллы по шкале Розенберга, а во втором — частота каждого балла. Эта таблица показывает, что трое студентов имели самооценку 24 балла, пятеро имели самооценку 23 балла и так далее. Из такой таблицы частот можно быстро увидеть несколько важных аспектов распределения, включая диапазон оценок (от 15 до 24), наиболее и наименее распространенные оценки (22 и 17 соответственно) и любые экстремальные оценки, которые выдерживаются. вне от остальных.


Таблица 12.1 Таблица частот, показывающая гипотетическое распределение баллов по шкале самооценки Розенберга


Самооценка Частота

24 3

23 5

22 10

21 8

20 5

19 3

18 3

17 0

16 2

15 1

Есть еще несколько моментов, которые стоит отметить в отношении частотных таблиц. Во-первых, уровни, перечисленные в первом столбце, обычно идут от самого высокого вверху к самому низкому внизу, и обычно они не выходят за пределы самых высоких и самых низких оценок в данных. Например, хотя баллы по шкале Розенберга могут варьироваться от 30 до 0, таблица 12.1 «Таблица частот, показывающая гипотетическое распределение баллов по шкале самооценки Розенберга» включает только уровни от 24 до 15, поскольку Диапазон включает все оценки в этом конкретном наборе данных. Во-вторых, при наличии множества различных оценок в широком диапазоне значений часто лучше создать сгруппированную таблицу частот, в которой в первом столбце перечислены диапазоны значений, а во втором — частота оценок в каждом диапазоне.Таблица 12.2 «Сгруппированная таблица частот, показывающая гипотетическое распределение времени реакции» , например, представляет собой сгруппированную таблицу частот, показывающую гипотетическое распределение времени простой реакции для выборки из 20 участников. В сгруппированной таблице частот все диапазоны должны быть одинаковой ширины, и обычно их от пяти до 15. Наконец, частотные таблицы также можно использовать для категориальных переменных, и в этом случае уровни являются метками категорий. Порядок меток категорий несколько произволен, но они часто перечислены от наиболее часто встречающихся вверху до наименее часто встречающихся внизу.


Таблица 12.2 Сгруппированная таблица частот, показывающая гипотетическое распределение времени реакции


Время реакции (мс) Частота

241–260 1

221–240 2

201–220 2

181–200 9

161–180 4

141–160 2

Гистограммы

Гистограмма — это графическое изображение распределения. В нем представлена ​​та же информация, что и в таблице частот, но в еще более быстром и легком для понимания виде. Гистограмма на рисунке 12.1 «Гистограмма, показывающая распределение баллов самооценки, представленных в» представляет распределение баллов самооценки в таблице 12.1 «Таблица частот, показывающая гипотетическое распределение баллов по шкале самооценки Розенберга» . Ось x гистограммы представляет переменную, а ось y представляет частоту. Над каждым уровнем переменной на x-ось представляет собой вертикальную черту, которая представляет количество людей с этим баллом. Когда переменная является количественной, как в этом примере, между столбцами обычно нет промежутка. Однако когда переменная является категориальной, между ними обычно есть небольшой разрыв. (Разрыв в 17 на этой гистограмме отражает тот факт, что в этом наборе данных не было 17 баллов.)


Рисунок 12.1 Гистограмма, показывающая распределение баллов самооценки, представленное в таблице 12.1 «Таблица частот, показывающая гипотетическое распределение баллов по шкале самооценки Розенберга»



Формы распределения

Когда распределение количественной переменной отображается на гистограмме, оно имеет форму. Типична форма распределения оценок самооценки на рис. 12.1 «Гистограмма, показывающая распределение оценок самооценки, представленных на» . Есть пик где-то около середины распределения и «хвосты», которые сужаются в любом направлении от пика. Распределение на рис. 12.1 «Гистограмма, показывающая распределение показателей самооценки, представленное в » является унимодальным, то есть имеет один отчетливый пик, но распределения также могут быть бимодальными, то есть они имеют два отчетливых пика. Рисунок 12.2 «Гистограмма, показывающая гипотетическое бимодальное распределение баллов по шкале депрессии Бека», например, показывает гипотетическое бимодальное распределение баллов по опроснику депрессии Бека. Распределения также могут иметь более двух отчетливых пиков, но в психологических исследованиях они встречаются относительно редко.


Рисунок 12.2. Гистограмма, показывающая гипотетическое бимодальное распределение баллов по шкале депрессии Бека.



Другой характеристикой формы распределения является то, является ли оно симметричным или асимметричным. Распределение в центре рисунка 12.3 «Гистограммы, показывающие распределение с отрицательным, симметричным и положительным смещением» является симметричным . Его левая и правая половины являются зеркальным отражением друг друга. Распределение слева имеет отрицательную асимметрию , его пик смещен к верхней границе диапазона и относительно длинный отрицательный хвост. Распределение справа имеет положительную асимметрию с пиком в нижней части диапазона и относительно длинным положительным хвостом.


Рисунок 12.3 . Гистограммы, показывающие распределения с отрицательным, симметричным и положительным наклоном



Выброс — это крайняя оценка, которая намного выше или ниже остальных оценок в распределении. Иногда выбросы представляют собой действительно экстремальные значения интересующей нас переменной. Например, в опроснике депрессии Бека один человек с клинической депрессией может быть исключением в выборке счастливых и хорошо функционирующих сверстников. Однако выбросы могут также указывать на ошибки или непонимание со стороны исследователя или участника, неисправности оборудования или аналогичные проблемы. Подробнее о том, как интерпретировать выбросы и что с ними делать, мы поговорим позже в этой главе.


Меры центральной тенденции и изменчивости

Также полезно иметь возможность более точно описать характеристики распределения. Здесь мы рассмотрим, как это сделать с точки зрения двух важных характеристик: их центральной тенденции и их изменчивости.


Главная тенденция

Центральной тенденцией распределения является его середина — точка, вокруг которой имеют тенденцию группироваться оценки в распределении. (Другой термин для обозначения центральной тенденции — средняя .) Оглядываясь назад на рисунок 12.1 «Гистограмма, показывающая распределение показателей самооценки, представленных в» , например, мы можем видеть, что показатели самооценки имеют тенденцию концентрироваться вокруг значений от 20 до 22. Здесь мы рассмотрим три наиболее распространенных показателя центральной тенденции: среднее значение, медиану и моду.


Среднее значение распределения (обозначается символом M ) представляет собой сумму баллов, деленную на количество баллов. В виде формулы это выглядит так:


В этой формуле символ Σ (греческая буква сигма) является знаком суммирования и означает суммирование значений переменной X . N представляет количество баллов. Среднее значение, безусловно, является наиболее распространенным показателем центральной тенденции, и для этого есть несколько веских причин. Обычно он дает хорошее представление о центральной тенденции распределения и легко понятен большинству людей. Кроме того, среднее значение имеет статистические свойства, которые делают его особенно полезным при выводе статистики.


Альтернативой среднему является медиана. Медиана — это средний балл в том смысле, что половина баллов в распределении меньше его, а половина больше его. Самый простой способ найти медиану — упорядочить оценки от низших к высшим и расположить оценку посередине. Рассмотрим, например, следующий набор из семи баллов:


8 4 12 14 3 2 3

Чтобы найти медиану, просто переставьте баллы от самого низкого к самому высокому и найдите тот, который находится посередине.


2 3 3 4 8 12 14

В этом случае медиана равна 4, потому что есть три балла ниже 4 и три балла выше 4. Когда имеется четное количество баллов, в середине распределения находятся два балла, и в этом случае медиана является значение на полпути между ними. Например, если бы мы добавили к предыдущему набору данных оценку 15, в середине распределения оказались бы две оценки (обе 4 и 8), а медиана оказалась бы посередине между ними (6).


Последним показателем центральной тенденции является мода. Мода — это наиболее часто встречающаяся оценка в распределении. В распределении самооценки, представленном в таблице 12.1 «Таблица частот, показывающая гипотетическое распределение баллов по шкале самооценки Розенберга» и на рисунке 12.1 «Гистограмма, показывающая распределение баллов самооценки, представленных в » , например, режим 22. Такой балл был у большего числа студентов, чем любой другой. Мода — это единственная мера центральной тенденции, которую также можно использовать для категориальных переменных.


В одномодальном и симметричном распределении среднее значение, медиана и мода будут очень близки друг к другу на пике распределения. В бимодальном или асимметричном распределении среднее значение, медиана и мода могут быть совершенно разными. В бимодальном распределении среднее значение и медиана будут находиться между пиками, а мода будет находиться на самом высоком пике. В асимметричном распределении среднее значение будет отличаться от медианы в направлении асимметрии (т. е. в направлении более длинного хвоста). Для распределений с большой асимметрией среднее значение может быть сдвинуто настолько далеко в направлении асимметрии, что оно уже не является хорошей мерой центральной тенденции этого распределения. Представьте, например, набор из четырех простых времен реакции: 200, 250, 280 и 250 миллисекунд (мс). Среднее значение составляет 245 мс. Но добавление еще одной оценки 5, 000 мс — возможно, потому, что участник не обращал внимания — увеличило бы среднее значение до 1445 мс. Мало того, что эта мера центральной тенденции превышает 80% баллов в распределении, она также, по-видимому, не очень хорошо отражает поведение кого-либо в распределении. Вот почему исследователи часто предпочитают медиану для сильно асимметричных распределений (таких как распределения времени реакции).


Однако имейте в виду, что при анализе данных вам не обязательно выбирать единственную меру центральной тенденции. Каждый из них предоставляет немного разную информацию, и все они могут быть полезны.


Меры изменчивости

Изменчивость распределения — это степень, в которой оценки варьируются вокруг своей центральной тенденции. Рассмотрим два распределения на рис. 12.4 «Гистограммы, показывающие гипотетические распределения с одним и тем же средним значением, медианой и модой (10), но с низкой изменчивостью (вверху) и высокой изменчивостью (внизу)» , оба из которых имеют одну и ту же центральную тенденцию. Среднее значение, медиана и мода каждого распределения равны 10. Обратите внимание, однако, что эти два распределения различаются с точки зрения их изменчивости. Верхний имеет относительно низкую изменчивость, все оценки относительно близки к центру. Нижний имеет относительно высокую изменчивость, а оценки разбросаны по гораздо большему диапазону.


Рис. 12.4 . Гистограммы, показывающие гипотетические распределения с одинаковыми средним значением, медианой и модой (10), но с низкой вариабельностью (вверху) и высокой вариабельностью (внизу)



Одной из простых мер изменчивости является диапазон , который представляет собой просто разницу между наивысшим и наименьшим баллами в распределении. Диапазон значений самооценки в таблице 12.1 «Таблица частот, показывающая гипотетическое распределение баллов по шкале самооценки Розенберга», например, представляет собой разницу между самым высоким баллом (24) и самым низким баллом (15). То есть диапазон равен 24 − 15 = 9. Хотя диапазон легко вычислить и понять, он может ввести в заблуждение, когда есть выбросы. Представьте себе, например, экзамен, на котором все студенты набрали от 90 до 100 баллов. Он имеет диапазон 10. Но если бы был один студент, набравший 20 баллов, диапазон увеличился бы до 80, создавая впечатление, что баллы были одинаковыми. весьма различны, когда на самом деле только один ученик существенно отличался от остальных.


Безусловно, наиболее распространенной мерой изменчивости является стандартное отклонение. Стандартное отклонение распределения — это, грубо говоря, среднее расстояние между оценками и средним значением. Например, стандартные отклонения распределений на рис. 12.4 «Гистограммы, показывающие гипотетические распределения с одинаковыми средним значением, медианой и модой (10), но с низкой изменчивостью (вверху) и высокой изменчивостью (внизу)» составляют 1,69 для верхнего распределения и 4.30 для нижнего. То есть, в то время как баллы в верхнем распределении отличаются от среднего примерно на 1,69 единицы в среднем, баллы в нижнем распределении отличаются от среднего примерно на 4,30 единицы в среднем.


Вычисление стандартного отклонения связано с небольшой сложностью. В частности, он включает в себя нахождение разницы между каждой оценкой и средним значением, возведение каждой разницы в квадрат, нахождение среднего значения этих квадратов разностей и, наконец, нахождение квадратного корня из этого среднего значения. Формула выглядит следующим образом:



Вычисления стандартного отклонения проиллюстрированы для небольшого набора данных в таблице 12.3 «Вычисления стандартного отклонения» . Первый столбец представляет собой набор из восьми оценок со средним значением 5. Второй столбец представляет собой разницу между каждой оценкой и средним значением. Третий столбец представляет собой квадрат каждой из этих разностей. Обратите внимание, что хотя различия могут быть отрицательными, квадраты различий всегда положительны, а это означает, что стандартное отклонение всегда положительно. В нижней части третьего столбца находится среднее значение квадратов разностей, которое также называется дисперсией (обозначается как SD 2 ).). Хотя дисперсия сама по себе является мерой изменчивости, она обычно играет большую роль в выводной статистике, чем в описательной статистике. Наконец, под дисперсией находится квадратный корень из дисперсии, который является стандартным отклонением.


Таблица 12.3 Расчеты стандартного отклонения


Икс Х – М ( Икс - М ) 2

3 −2 4

5 0 0

4 −1 1

2 −3 9

7 2 4

6 1 1

5 0 0

8 3 9

М = 5

N или N - 1

Если вы уже прошли курс статистики, вы, возможно, научились делить сумму квадратов разностей на N - 1, а не на N , когда вычисляете дисперсию и стандартное отклонение. Почему это?


По определению стандартное отклонение представляет собой квадратный корень из среднего значения квадратов разностей. Это подразумевает деление суммы квадратов разностей на N , как в только что представленной формуле. Вычисление стандартного отклонения таким образом уместно, когда ваша цель состоит в том, чтобы просто описать изменчивость в образце. И изучение этого таким образом подчеркивает, что дисперсия на самом деле является средним значением квадратов разностей, а стандартное отклонение — это квадратный корень из этого среднего .


Однако большинство калькуляторов и пакетов программного обеспечения делят сумму квадратов разностей на N - 1. Это связано с тем, что стандартное отклонение выборки имеет тенденцию быть немного ниже, чем стандартное отклонение совокупности, из которой была выбрана выборка. Деление суммы квадратов на N − 1 корректирует эту тенденцию и дает более точную оценку стандартного отклонения генеральной совокупности. Поскольку исследователи обычно думают о своих данных как о выборке, отобранной из большей совокупности, и поскольку они, как правило, заинтересованы в выводах о населении, имеет смысл регулярно применять эту поправку.


Процентильные ранги и z - оценки

Во многих ситуациях полезно иметь способ описать положение отдельной оценки в ее распределении. Одним из подходов является процентильный ранг. Процентильный ранг оценки — это процент оценок в распределении, которые ниже этой оценки. Рассмотрим, например, распределение в таблице 12.1 «Таблица частот, показывающая гипотетическое распределение баллов по шкале самооценки Розенберга» . Для любой оценки в распределении мы можем найти ее процентильный ранг, подсчитав количество оценок в распределении, которые ниже этой оценки, и преобразовав это число в процент от общего количества оценок. Обратите внимание, например, что пять студентов, представленных данными вВ Таблице 12.1 «Таблица частот, показывающая гипотетическое распределение баллов по шкале самооценки Розенберга» самооценка равнялась 23 баллам. В этом распределении 32 из 40 баллов (80%) ниже 23. Таким образом, каждый из этих студентов имеет процентильный ранг 80. (Можно также сказать, что они набрали «80-й процентиль».) Процентильные ранги часто используются для сообщения результатов стандартизированных тестов способностей или достижений. Например, если ваш процентильный ранг в тесте на вербальные способности равен 40, это будет означать, что вы набрали больше, чем 40% людей, прошедших тест.


Другой подход — оценка z . Оценка z для конкретного человека представляет собой разницу между оценкой этого человека и средним значением распределения, деленную на стандартное отклонение распределения :


Показатель z указывает, насколько выше или ниже среднего находится необработанный показатель, но он выражает это в терминах стандартного отклонения. Например, при распределении оценок коэффициента интеллекта (IQ) со средним значением 100 и стандартным отклонением 15 показатель IQ 110 будет иметь z -показатель (110 - 100) / 15 = +0,67. Другими словами, оценка 110 на 0,67 стандартного отклонения (примерно две трети стандартного отклонения) выше среднего. Точно так же исходная оценка 85 будет иметь z -оценку (85 - 100) / 15 = -1,00. Другими словами, 85 баллов — это одно стандартное отклонение ниже среднего.


Есть несколько причин, по которым z -показатели важны. Опять же, они обеспечивают способ описания того, где находится индивидуальный балл в распределении, и иногда используются для сообщения результатов стандартизированных тестов. Они также обеспечивают один из способов определения выбросов. Например, выбросы иногда определяются как оценки, у которых z -оценка меньше -3,00 или больше +3,00. Другими словами, они определяются как баллы, которые более чем на три стандартных отклонения от среднего значения. Наконец, z -показатели играют важную роль в понимании и вычислении других статистических данных, как мы вскоре увидим.


Описательная онлайн-статистика

Хотя многие исследователи используют коммерчески доступное программное обеспечение, такое как SPSS и Excel, для анализа своих данных, существует несколько бесплатных онлайн-инструментов для анализа, которые также могут быть чрезвычайно полезными. Многие позволяют вам вводить или загружать свои данные, а затем одним щелчком мыши проводить несколько описательных статистических анализов. Среди них следующие.


Виртуальная лаборатория риса по статистике


http://onlinestatbook.com/stat_analysis/index.html


VassarStats


http://faculty.vassar.edu/lowry/VassarStats.html


Яркий стат


http://www.brightstat.com


Более полный список см . на http://statpages.org/index.html .


КЛЮЧЕВЫЕ ВЫВОДЫ

Каждая переменная имеет распределение — способ распределения оценок по уровням. Распределение можно описать с помощью таблицы частот и гистограммы. Его также можно описать словами с точки зрения его формы, в том числе, является ли он одномодальным или бимодальным, а также является ли он симметричным или перекошенным.

Центральную тенденцию, или середину, распределения можно точно описать с помощью трех статистик — среднего, медианы и моды. Среднее значение представляет собой сумму баллов, деленную на количество баллов, медиана — это средний балл, а мода — это наиболее распространенный балл.

Изменчивость или разброс распределения можно точно описать с помощью диапазона и стандартного отклонения. Диапазон — это разница между самой высокой и самой низкой оценкой, а стандартное отклонение — это примерно средняя величина, на которую оценки отличаются от среднего.

Расположение оценки в ее распределении можно описать с помощью процентилей или z - оценок. Процентиль оценки — это процент оценок ниже этой оценки, а z - оценка — это разница между оценкой и средним значением, деленная на стандартное отклонение.

УПРАЖНЕНИЯ

Практика: Составьте частотную таблицу и гистограмму для следующих данных. Затем напишите краткое описание формы распределения словами.


11, 8, 9, 12, 9, 10, 12, 13, 11, 13, 12, 6, 10, 17, 13, 11, 12, 12, 14, 14


Практика. Для данных в упражнении 1 вычислите среднее значение, медиану, моду, стандартное отклонение и диапазон.

Практика: используя данные из упражнений 1 и 2, найдите (а) процентные ранги для оценок 9 и 14 и (б) z - значения для оценок 8 и 12.

12.2 Описание статистических взаимосвязей

ЦЕЛИ ОБУЧЕНИЯ

Опишите различия между группами с точки зрения их средних значений и стандартных отклонений, а также с точки зрения d Коэна .

Опишите корреляции между количественными переменными в терминах r Пирсона .

Как мы видели на протяжении всей этой книги, самые интересные исследовательские вопросы в психологии связаны со статистическими отношениями между переменными. Напомним, что существует статистическая связь между двумя переменными, когда средний балл по одной систематически различается по уровням другой. В этом разделе мы вернемся к двум основным формам статистических отношений, представленным ранее в книге, — различиям между группами или условиями и отношениям между количественными переменными — и рассмотрим, как их описать более подробно.


Различия между группами или условиями

Различия между группами или состояниями обычно описываются в терминах среднего значения и стандартного отклонения для каждой группы или состояния. Например, Томас Оллендик и его коллеги провели исследование, в котором оценили два однократных лечения простых фобий у детей (Ollendick et al., 2009). Оллендик, Т. Х., Ост, Л.-Г., Рейтершельд, Л., Коста, Н., Седерлунд, Р., Сирбу, К.,… Джарретт, Массачусетс (2009). Лечение специфических фобий у молодежи за один сеанс: рандомизированное клиническое исследование в США и Швеции. Журнал консалтинга и клинической психологии, 77 , 504–516.Они случайным образом распределяли детей с сильным страхом (например, перед собаками) в одно из трех состояний. В условиях воздействия дети фактически столкнулись с объектом своего страха под руководством обученного терапевта. В условиях обучения они узнали о фобиях и некоторых стратегиях борьбы с ними. В контрольном состоянии списка ожидания они ожидали лечения после завершения исследования. Тяжесть фобии каждого ребенка затем оценивалась по шкале от 1 до 8 врачом, который не знал, какое лечение получал ребенок. (Это была одна из нескольких зависимых переменных.) Средняя оценка страха в условиях обучения составила 4,83 при стандартном отклонении 1,52, в то время как средняя оценка страха в условиях воздействия составила 3,47 при стандартном отклонении 1,77. Средняя оценка страха в контрольном состоянии составила 5. 56 со стандартным отклонением 1,21. Другими словами, оба метода лечения работали, но метод воздействия работал лучше, чем метод обучения. Как мы видели, различия между средними группами или условиями могут быть представлены в виде гистограммы, подобной приведенной вРисунок 12.5 «Гистограмма, показывающая средние оценки фобии клиницистов для детей в двух условиях лечения» , где высота столбцов представляет средние значения для группы или состояния. Вскоре мы более подробно рассмотрим создание гистограмм в стиле Американской психологической ассоциации (АПА).


Рис. 12.5 Гистограмма, показывающая средние оценки фобии клиницистов для детей в двух условиях лечения



Также важно уметь описывать силу статистической зависимости, которую часто называют величиной эффекта . Наиболее широко используемая мера размера эффекта для различий между средними группами или состояниями называется d Коэна , которая представляет собой разницу между двумя средними значениями, деленную на стандартное отклонение:


В этой формуле не имеет большого значения, какое среднее значение равно M 1 , а какое — M 2 . Если есть группа лечения и контрольная группа, среднее значение группы лечения обычно равно М 1 , а среднее значение контрольной группы равно М 2 . В противном случае большее среднее обычно равно M 1 , а меньшее среднее M 2 , так что d Коэнаоказывается положительным. Стандартное отклонение в этой формуле обычно представляет собой своего рода среднее значение двух групповых стандартных отклонений, называемое стандартным отклонением объединенных групп. Чтобы вычислить объединенное стандартное отклонение внутри групп, добавьте сумму квадратов различий для группы 1 к сумме квадратов различий для группы 2, разделите это на сумму двух размеров выборки, а затем извлеките из нее квадратный корень. Однако неформально вместо этого можно использовать стандартное отклонение любой группы.


Концептуально d Коэна представляет собой разницу между двумя средними значениями, выраженную в единицах стандартного отклонения. (Обратите внимание на его сходство с оценкой z , которая выражает разницу между индивидуальной оценкой и средним значением в единицах стандартного отклонения.) Значение d Коэна, равное 0,50, означает, что средние значения двух групп отличаются на 0,50 стандартных отклонений (половина стандартного отклонения). Коэффициент Коэна, равный 1,20, означает, что они отличаются на 1,20 стандартных отклонения. Но как мы должны интерпретировать эти значения с точки зрения силы связи или размера разницы между средними значениями? В таблице 12.4 «Рекомендации по обращению к Коэну» представлены некоторые рекомендации по интерпретации d Коэна.ценности в психологических исследованиях (Cohen, 1992). Коэн, Дж. (1992). Силовой праймер. Психологический бюллетень, 112 , 155–159. Значения около 0,20 считаются малыми, значения около 0,50 считаются средними, а значения около 0,80 считаются большими. Таким образом, значение d Коэна, равное 0,50, представляет собой среднюю разницу между двумя средними значениями, а значение d Коэна, равное 1,20, представляет собой очень большую разницу в контексте психологических исследований. В исследовании Оллендика и его коллег наблюдалась большая разница ( d = 0,82) между условиями воздействия и образования.


Таблица 12.4 Рекомендации по использованию значений Коэна d и Пирсона r как «сильных», «средних» или «слабых»


Сила отношений Коэн д Пирсон р

Сильный/большой ± 0,80 ± 0,50

Середина ± 0,50 ± 0,30

Слабый/маленький ± 0,20 ± 0,10

Коэффициент d Коэна полезен, потому что он имеет одно и то же значение независимо от сравниваемой переменной или шкалы, по которой она была измерена. Коэффициент Коэна, равный 0,20, означает, что средние значения двух групп отличаются на 0,20 стандартных отклонений, независимо от того, говорим ли мы об оценках по шкале самооценки Розенберга, времени реакции, измеренном в миллисекундах, количестве братьев и сестер или диастолическом артериальном давлении, измеренном в миллиметрах ртутного столба. Это не только облегчает исследователям обмен информацией друг с другом о своих результатах, но также позволяет комбинировать и сравнивать результаты разных исследований с использованием разных показателей.


Имейте в виду, что термин « величина эффекта » может ввести в заблуждение, поскольку предполагает наличие причинно-следственной связи — что разница между двумя средними значениями является «эффектом» пребывания в одной группе или состоянии, а не в другом. Представьте себе, например, исследование, показывающее, что группа занимающихся спортом в среднем счастливее, чем группа не занимающихся спортом, с «величиной эффекта» d .= 0,35. Если бы исследование было экспериментом — с участниками, случайным образом распределенными в условия упражнений и без упражнений, — тогда можно было бы сделать вывод, что упражнения вызывали небольшое или среднее увеличение счастья. Однако если бы исследование было корреляционным, то можно было бы сделать вывод только о том, что тренирующиеся были счастливее тех, кто не тренировался, на небольшую или среднюю величину. Другими словами, простое определение разницы как «величины эффекта» не делает связь причинно-следственной.


Половые различия, выраженные как Коэнов d

Исследователь Джанет Шибли Хайд изучила результаты многочисленных исследований психологических половых различий и выразила их в терминах d Коэна (Hyde, 2007). Хайд, Дж. С. (2007). Новые направления в изучении гендерных сходств и различий. Текущие направления в психологической науке, 16 , 259–263. Ниже приведены некоторые значения, которые она нашла, усредненные по нескольким исследованиям в каждом случае. (Обратите внимание, что поскольку она всегда рассматривает среднее значение для мужчин как M 1 , а среднее значение для женщин как M 2 , положительные значения указывают на то, что мужчины набирают более высокие баллы, а отрицательные значения указывают на то, что женщины набирают более высокие баллы.)


Решение математических задач +0,08

Понимание прочитанного −0,09

Улыбается −0,40

Агрессия +0,50

Отношение к случайному сексу +0,81

Эффективность лидерства −0,02

Хайд указывает, что, хотя мужчины и женщины сильно различаются по некоторым переменным (например, по отношению к случайным половым связям), они отличаются лишь незначительно по подавляющему большинству. Во многих случаях d Коэна меньше 0,10, что она называет «тривиальной» разницей. (Различие в разговорчивости, обсуждавшееся в главе 1 «Психологическая наука» , также было тривиальным: d = 0,06.) Хотя как исследователи, так и неисследователи часто подчеркивают половые различия , Хайд утверждал, что не менее разумно думать о мужчинах и женщины принципиально похожи . Она называет это «гипотезой гендерного сходства».


Корреляции между количественными переменными

Как мы видели на протяжении всей книги, многие интересные статистические взаимосвязи принимают форму корреляций между количественными переменными. Например, исследователи Курт Карлсон и Жаклин Конард провели исследование взаимосвязи между алфавитным положением первой буквы фамилий людей (от A = 1 до Z = 26) и тем, насколько быстро эти люди реагировали на призывы потребителей (Carlson & Conard). , 2011). Карлсон, К.А., и Конард, Дж.М. (2011). Эффект фамилии: как фамилия влияет на время приобретения. Журнал потребительских исследований . дои: 10.1086/658470В одном исследовании они разослали электронные письма большой группе студентов MBA, предлагая бесплатные билеты на баскетбол из ограниченного количества. В результате, чем ближе к концу алфавита стояли фамилии студентов, тем быстрее они отвечали. Эти результаты обобщены на рис. 12.7 «Линейный график, показывающий взаимосвязь между расположением фамилий людей в алфавитном порядке и тем, насколько быстро эти люди реагируют на предложения потребительских товаров» .


Рис. 12.7 Линейный график, показывающий взаимосвязь между расположением фамилий людей в алфавитном порядке и тем, насколько быстро эти люди реагируют на предложения потребительских товаров



Такие отношения часто представляются с помощью линейных графиков или диаграмм рассеяния, которые показывают, как уровень одной переменной различается в диапазоне другой. Например, на линейном графике на рис. 12.7 «Линейный график, показывающий взаимосвязь между расположением фамилий людей в алфавитном порядке и тем, как быстро эти люди реагируют на предложения потребительских товаров» , каждая точка представляет среднее время отклика для участников с фамилиями в первый, второй, третий и четвертый квартили (или четверти) распределения имен. Это ясно показывает, как время отклика имеет тенденцию к снижению по мере приближения фамилий людей к концу алфавита. Диаграмма рассеяния вНа рис. 12.8 «Статистическая взаимосвязь между оценками нескольких студентов колледжа по шкале самооценки Розенберга, полученной два раза с разницей в неделю» , воспроизведенной из главы 5 «Психологические измерения» , показана взаимосвязь между оценками студентов по 25 методам исследования по шкале самооценки Розенберга. Шкала самооценки Розенберга проводится два раза с интервалом в неделю. Здесь баллы представляют отдельных лиц, и мы можем видеть, что чем выше учащиеся набрали баллы в первый раз, тем выше они, как правило, набирали баллы во второй раз. Как правило, линейные графики используются, когда переменная на оси x имеет (или организована) небольшое количество различных значений, таких как четыре квартили распределения имен. Диаграммы рассеяния используются, когда переменная на x-ось имеет большое количество значений, таких как различные возможные оценки самооценки.


Рис. 12.8 Статистическая зависимость между оценками нескольких студентов колледжа по шкале самооценки Розенберга, полученной два раза с разницей в неделю



Данные, представленные на рис. 12.8 «Статистическая взаимосвязь между оценками нескольких студентов колледжа по шкале самооценки Розенберга, полученными два раза с интервалом в неделю» , представляют собой хороший пример положительной взаимосвязи, при которой более высокие баллы по одной переменной, как правило, связаны с более высокими баллами по другому (так, чтобы точки шли из левого нижнего угла в правый верхний угол графика). Данные, представленные на рис. 12.7 «Линейный график, показывающий взаимосвязь между расположением фамилий людей в алфавитном порядке и тем, насколько быстро эти люди реагируют на предложения потребительских товаров» , представляют собой хороший пример отрицательной взаимосвязи.


Оба этих примера также являются линейными отношениями, в которых точки достаточно хорошо укладываются одной прямой линией. Нелинейные отношения — это отношения, в которых точки лучше соответствуют изогнутой линии. Рисунок 12.9 «Гипотетическая нелинейная зависимость между тем, сколько человек спит за ночь, и тем, насколько они подавлены», например, показывает гипотетическую связь между количеством сна, которое люди получают за ночь, и уровнем их депрессии. В этом примере линия, которая лучше всего соответствует точкам, представляет собой кривую — своего рода перевернутую букву «U», потому что люди, которые спят около восьми часов, как правило, менее всего подвержены депрессии, в то время как те, кто спит слишком мало, и те, кто слишком много сна, как правило, более депрессии. Нелинейные отношения не редкость в психологии, но их подробное обсуждение выходит за рамки этой книги.


Рис. 12.9 . Гипотетическая нелинейная зависимость между тем, сколько человек спит за ночь, и степенью депрессии



Как мы видели ранее в книге, сила корреляции между количественными переменными обычно измеряется с помощью статистики, называемой r Пирсона . Как показано на рис. 12.10, «коэффициент Пирсона» может принимать значения от -1,00 до нуля и +1,00. Значение 0 означает, что между двумя переменными нет связи. В дополнение к своим рекомендациям по интерпретации d Коэна, Коэн предложил рекомендации по интерпретации r Пирсона в психологических исследованиях (см. Таблицу 12.4 «Рекомендации по использованию Коэна» ). Значения около ± 0,10 считаются малыми, значения около ± 0,30 считаются средними, а значения около ± 0,50 считаются большими. Обратите внимание, что знак Пирсона rне зависит от его силы. Например, значения r Пирсона +, 30 и -0,30 одинаково сильны; просто одно представляет умеренное положительное отношение, а другое умеренное отрицательное отношение. Подобно d Коэна , r Пирсона также называют мерой «величины эффекта», хотя связь может и не быть причинно-следственной.


Рис. 12.10 Диапазон значений r Пирсона от –1,00 (представляет самую сильную возможную отрицательную связь), через 0 (представляющую отсутствие связи) до +1,00 (представляющую самую сильную возможную положительную связь)



Вычисления для r Пирсона более сложны, чем для d Коэна . Хотя вам, возможно, никогда не придется делать их вручную, все же поучительно посмотреть, как это сделать. В вычислительном отношении r Пирсона представляет собой «среднее перекрестное произведение z - баллов». Чтобы вычислить его, нужно начать с преобразования всех оценок в z - оценки. Для переменной X вычтите среднее значение X из каждой оценки и разделите каждую разницу на стандартное отклонение X . Для переменной Y вычтите среднее значение Y из каждой оценки и разделите каждую разницу на стандартное отклонение Y.. Затем для каждого человека умножьте два показателя z вместе, чтобы получить перекрестный продукт. Наконец, возьмите среднее значение перекрестных произведений. Формула выглядит следующим образом:


Таблица 12.5 «Примеры вычислений для Пирсона» иллюстрируют эти вычисления для небольшого набора данных. В первом столбце перечислены баллы для переменной X , которая имеет среднее значение 4,00 и стандартное отклонение 1,90. Второй столбец представляет собой оценку z для каждой из этих необработанных оценок. В третьем и четвертом столбцах перечислены необработанные оценки для переменной Y , которая имеет среднее значение 40 и стандартное отклонение 11,78, а также соответствующие оценки z . В пятой колонке перечислены перекрестные продукты. Например, первый равен 0,00, умноженному на -0,85, что равно 0,00. Второй равен 1,58, умноженному на 1,19, что равно 1,88. Среднее значение этих перекрестных произведений, показанное внизу этой колонки, равно r Пирсона., что в данном случае равно +0,53. Существуют и другие формулы для вычисления r Пирсона вручную, которые могут быть быстрее. Этот подход, однако, гораздо яснее с точки зрения концептуальной передачи того, что такое пирсоновское r .


Таблица 12.5 Примеры вычислений для Пирсона r


Икс г х Д г у г х г у

4 0,00 30 −0,85 0,00

7 1,58 54 1.19 1,88

2 −1,05 23 −1,44 1,52

5 0,53 43 0,26 0,13

2 −1,05 50 0,85 −0,89

М х = 4,00 М г = 40,00 г = 0,53

SD х = 1,90 SD у = 11,78

Есть две распространенные ситуации, в которых значение r Пирсона может ввести в заблуждение. Во-первых, когда изучаемые отношения нелинейны. Хотя на рис. 12.9 «Гипотетическая нелинейная зависимость между тем, сколько человек спит за ночь, и тем, насколько они подавлены» показана довольно сильная связь между депрессией и сном, r Пирсона будет близок к нулю, поскольку точки на диаграмме рассеяния не совсем совпадают. одной прямой линией. Это означает, что важно построить диаграмму рассеяния и убедиться, что связь приблизительно линейна, прежде чем использовать r Пирсона . Другой — когда одна или обе переменные имеют ограниченный диапазон в выборке по сравнению с генеральной совокупностью. Это называетсяограничение ассортимента . Предположим, например, что существует сильная отрицательная корреляция между возрастом людей и их увлечением хип-хопом, как показано на диаграмме рассеяния на рис. Диапазон» . Здесь r Пирсонасоставляет −0,77. Однако, если бы мы собирали данные только о подростках в возрасте от 18 до 24 лет, представленные заштрихованной областью на рис. 12.11 «Гипотетические данные, показывающие, как сильная общая корреляция может казаться слабой, когда одна переменная имеет ограниченный диапазон» — тогда связь будет казаться довольно слабой. На самом деле, г Пирсонадля этого ограниченного диапазона возрастов равен 0. Поэтому было бы неплохо спланировать исследования так, чтобы избежать ограничения диапазона. Например, если возраст является одной из ваших основных переменных, вы можете запланировать сбор данных от людей самых разных возрастов. Однако, поскольку ограничение диапазона не всегда можно предвидеть или легко избежать, хорошей практикой является проверка ваших данных на предмет возможного ограничения диапазона и интерпретация r Пирсона в свете этого. (Существуют также статистические методы коррекции пирсоновского r для ограничения диапазона, но они выходят за рамки этой книги).


Рис. 12.11 . Гипотетические данные, показывающие, как сильная общая корреляция может оказаться слабой, когда одна переменная имеет ограниченный диапазон



Общая корреляция здесь составляет -0,77, но корреляция для 18-24-летних (в синей рамке) равна 0.


КЛЮЧЕВЫЕ ВЫВОДЫ

Различия между группами или состояниями обычно описываются в терминах средних значений и стандартных отклонений групп или условий или в терминах d Коэна и представляются в виде гистограмм.

Коэнов d является мерой силы связи (или размера эффекта) для различий между двумя средними группами или состояниями. Это разница средних, деленная на стандартное отклонение. Как правило, значения ±0,20, ±0,50 и ±0,80 можно считать малыми, средними и большими соответственно.

Корреляции между количественными переменными обычно описываются в терминах r Пирсона и представляются в виде линейных графиков или диаграмм рассеяния.

Коэффициент Пирсона является мерой силы взаимосвязи (или размера эффекта) для взаимосвязей между количественными переменными. Это среднее перекрестное произведение двух наборов z - показателей. Как правило, значения ±0,10, ±0,30 и ±0,50 можно считать малыми, средними и большими соответственно.

УПРАЖНЕНИЯ

Практика: Следующие данные представляют собой баллы по шкале самооценки Розенберга для выборки из 10 японских студентов колледжей и 10 американских студентов колледжей. (Хотя эти данные и являются гипотетическими, они согласуются с эмпирическими данными [Schmitt & Allik, 2005]. Schmitt, DP, & Allik, J. (2005). Одновременное применение шкалы самооценки Розенберга в 53 странах: изучение универсального и культурного специфические особенности общей самооценки Journal of Personality and Social Psychology, 89 , 623–642. ) Вычислите средние значения и стандартные отклонения для двух групп, постройте столбчатую диаграмму, вычислите коэффициент Коэна d и опишите силу взаимосвязи. в словах.


Япония Соединенные Штаты

25 27

20 30

24 34

28 37

30 26

32 24

21 28

24 35

20 33

26 36

Практика. Нижеследующие гипотетические данные — это показатели экстраверсии и количество друзей на Facebook для 15 студентов колледжа. Постройте диаграмму рассеяния для этих данных, вычислите r Пирсона и опишите взаимосвязь словами.


Экстраверсия друзья на фейсбуке

8 75

10 315

4 28

6 214

12 176

14 95

10 120

11 150

4 32

13 250

5 99

7 136

8 185

11 88

10 144

12.3 Выражение результатов

ЦЕЛИ ОБУЧЕНИЯ

Напишите простую описательную статистику в стиле Американской психологической ассоциации (АПА).

Интерпретируйте и создавайте простые графики в стиле APA, включая гистограммы, линейные графики и диаграммы рассеяния.

Интерпретируйте и создавайте простые таблицы в стиле APA, включая таблицы средних значений групп или условий и корреляционные матрицы.

После того, как вы провели свой описательный статистический анализ, вам нужно будет представить его другим. В этом разделе мы сосредоточимся на представлении описательных статистических результатов в письменной форме, на графиках и в таблицах, следуя рекомендациям Американской психологической ассоциации (АПА) для письменных отчетов об исследованиях. Эти принципы можно легко адаптировать к другим форматам презентаций, таким как плакаты и слайд-шоу.


Представление описательной статистики в письменной форме

Когда у вас есть небольшое количество результатов для отчета, зачастую наиболее эффективно записывать их. Здесь есть несколько важных рекомендаций по стилю APA. Во-первых, статистические результаты всегда представляются в виде цифр, а не слов, и обычно округляются до двух знаков после запятой (например, «2,00», а не «два» или «2»). Они могут быть представлены либо в описательном описании результатов, либо в скобках, подобно ссылкам на источники. Вот некоторые примеры:


Средний возраст участников составил 22,43 года со стандартным отклонением 2,34.


Среди участников с низкой самооценкой те, кто находился в негативном настроении, выражали более сильное намерение заниматься незащищенным сексом ( M = 4,05, SD = 2,32), чем те, кто находился в позитивном настроении ( M = 2,15, SD = 2,27).


В группе лечения среднее значение составило 23,40 ( SD = 9,33), в то время как в контрольной группе среднее значение составило 20,87 ( SD = 8,45).


Корреляция между тестом и повторным тестом составила 0,96.


Между положением фамилий респондентов в алфавитном порядке и временем их ответа наблюдалась умеренная отрицательная корреляция ( r = -0,27).


Обратите внимание, что при представлении в описательной части термины « среднее » и « стандартное отклонение » выписаны, но при представлении в скобках вместо них используются символы M и SD . Обратите также внимание на то, что использование параллельного построения особенно важно для выражения сходных или сравнимых результатов сходными способами. Третий пример намного лучше, чем следующая непараллельная альтернатива:


Группа лечения имела среднее значение 23,40 ( SD = 9,33), в то время как 20,87 было средним значением контрольной группы, у которой было стандартное отклонение 8,45.


Представление описательной статистики в виде графиков

Когда у вас есть большое количество результатов для отчета, вы часто можете сделать это более четко и эффективно с помощью графика. Когда вы готовите графики для исследовательского отчета в стиле APA, вам следует помнить о некоторых общих рекомендациях. Во-первых, график всегда должен добавлять важную информацию, а не повторять информацию, которая уже присутствует в тексте или в таблице. (Если диаграмма представляет информацию более четко или эффективно, вам следует сохранить диаграмму и исключить текст или таблицу.) Во-вторых, диаграммы должны быть как можно более простыми. Например, Руководство по публикациине поощряет использование цвета, если в этом нет абсолютной необходимости (хотя цвет по-прежнему может быть эффективным элементом плакатов, презентаций в виде слайд-шоу или учебников). В-третьих, графики должны интерпретироваться сами по себе. Читатель должен быть в состоянии понять основной результат, основываясь только на графике и его подписи, и ему не нужно обращаться к тексту для объяснения.


Существует также еще несколько технических рекомендаций для графиков, которые включают следующее:


Макет


График должен быть немного шире, чем высота.

Независимая переменная должна быть нанесена на ось абсцисс , а зависимая переменная — на ось у .

Значения должны увеличиваться слева направо по оси x и снизу вверх по оси y .

Ярлыки и легенды оси


Метки осей должны быть четкими и лаконичными и включать единицы измерения, если они не указаны в подписи.

Метки осей должны быть параллельны оси.

Легенды должны появляться в границах графика.

Текст должен быть набран одним и тем же простым шрифтом и отличаться не более чем на четыре пункта.

Подписи


Подписи должны кратко описывать рисунок, объяснять любые сокращения и включать единицы измерения, если они не отображаются в метках осей.

Подписи в рукописи APA должны быть напечатаны на отдельной странице в конце рукописи. Дополнительную информацию см. в главе 11 «Представление вашего исследования» .

Гистограммы

Как мы видели в этой книге, гистограммы обычно используются для представления и сравнения средних показателей для двух или более групп или состояний. Гистограмма на рис. 12.12 «Образец гистограммы в стиле APA с планками погрешностей, представляющими стандартные ошибки, основанный на исследовании Оллендика и его коллег» представляет собой версию в стиле APA рис. Два состояния лечения» . Обратите внимание, что он соответствует всем перечисленным рекомендациям. Новый элемент на рис. 12.12 «Образец гистограммы в стиле APA с планками погрешностей, представляющими стандартные ошибки, на основе исследования Оллендика и его коллег».это меньшие вертикальные полосы, которые простираются как вверх, так и вниз от вершины каждой основной полосы. Это планки погрешностей , и они представляют изменчивость в каждой группе или состоянии. Хотя они иногда расширяют одно стандартное отклонение в каждом направлении, они с большей вероятностью увеличивают одну стандартную ошибку в каждом направлении (как на рис. Коллеги» ). Стандартная ошибкапредставляет собой стандартное отклонение группы, деленное на квадратный корень из размера выборки группы. Стандартная ошибка используется потому, что, как правило, разница между средними группами, превышающая две стандартные ошибки, является статистически значимой. Таким образом, можно «увидеть», является ли различие статистически значимым, на основе гистограммы с планками погрешностей.


Рисунок 12.12 . Пример гистограммы в стиле APA с планками погрешностей, представляющими стандартные ошибки, на основе исследования Оллендика и его коллег.



Линейные графики

Линейные графики используются для представления корреляций между количественными переменными, когда независимая переменная имеет или организована в относительно небольшое количество различных уровней. Каждая точка на линейном графике представляет собой средний балл по зависимой переменной для участников на одном уровне независимой переменной. Рисунок 12.13 «Пример линейного графика в стиле APA, основанный на исследованиях Карлсона и Конарда» представляет собой версию результатов Карлсона и Конарда в стиле APA. Обратите внимание, что он включает планки погрешностей, представляющие стандартную ошибку, и соответствует всем заявленным рекомендациям.


Рис. 12.13 . Пример линейного графика в стиле APA, основанный на исследованиях Карлсона и Конарда.



In most cases, the information in a line graph could just as easily be presented in a bar graph. In Figure 12.13 "Sample APA-Style Line Graph Based on Research by Carlson and Conard", for example, one could replace each point with a bar that reaches up to the same level and leave the error bars right where they are. This emphasizes the fundamental similarity of the two types of statistical relationship. Both are differences in the average score on one variable across levels of another. The convention followed by most researchers, however, is to use a bar graph when the variable plotted on the x-axis is categorical and a line graph when it is quantitative.


Scatterplots

Диаграммы рассеяния используются для представления отношений между количественными переменными, когда переменная на оси x (обычно независимая переменная) имеет большое количество уровней. Каждая точка на диаграмме рассеяния представляет человека, а не среднее значение для группы людей, и нет линий, соединяющих точки. График на рисунке 12.14 «Образец диаграммы рассеяния в стиле APA» представляет собой версию в стиле APA рисунка 12.8 «Статистическая взаимосвязь между оценками нескольких студентов колледжа по шкале самооценки Розенберга, полученной два раза с разницей в неделю» , которая иллюстрирует несколько дополнительные баллы. Во-первых, когда переменные пооси x и y-оси концептуально похожи и измеряются в одной шкале - как здесь, где они являются мерами одной и той же переменной в двух разных случаях - это можно подчеркнуть, сделав оси одинаковой длины. Во-вторых, когда два или более человека попадают в одну и ту же точку на графике, один из способов указать на это — слегка сместить точки по оси X. Другие способы заключаются в отображении количества особей в скобках рядом с точкой или в увеличении или уменьшении размера точки пропорционально количеству особей. Наконец, также может быть включена прямая линия, которая лучше всего соответствует точкам на диаграмме рассеяния, называемая линией регрессии.


Рисунок 12.14 Пример диаграммы рассеяния в стиле APA



Выражение описательной статистики в таблицах

Как и графики, таблицы можно использовать для четкого и эффективного представления больших объемов информации. К таблицам применяются те же общие принципы, что и к графикам. Они должны добавлять важную информацию к представлению ваших результатов, быть как можно более простыми и интерпретируемыми сами по себе. Опять же, мы сосредоточимся здесь на таблицах для рукописи в стиле APA.


Чаще всего таблицы используются для представления нескольких средних значений и стандартных отклонений — обычно для сложных планов исследований с множеством независимых и зависимых переменных. На рисунке 12.15 «Образец таблицы в стиле APA, представляющей средние значения и стандартные отклонения» , например, показаны результаты гипотетического исследования, аналогичного исследованию, проведенному MacDonald and Martineau (2002) MacDonald, TK, & Martineau, AM (2002). Самооценка, настроение и намерения использовать презервативы: когда низкая самооценка приводит к опасному для здоровья поведению? Журнал экспериментальной социальной психологии, 38 , 299–306. обсуждалось в главе 5 «Психологические измерения» . (Средние значения на рисунке 12.15 «Образец таблицы в стиле APA, представляющей средние значения и стандартные отклонения»являются средними значениями, указанными Макдональдом и Мартино, но не стандартными ошибками). Напомним, что эти исследователи классифицировали участников с низкой или высокой самооценкой, помещали их в негативное или позитивное настроение и измеряли их намерения заниматься незащищенным сексом. Хотя это и не упоминается в главе 5 «Психологические измерения»., они также измерили отношение участников к незащищенному сексу. Обратите внимание, что таблица включает горизонтальные линии, охватывающие всю таблицу вверху и внизу, а также непосредственно под заголовками столбцов. Кроме того, у каждого столбца есть заголовок, включая крайний левый столбец, а также дополнительные заголовки, охватывающие два или более столбца, которые помогают организовать информацию и представить ее более эффективно. Наконец, обратите внимание, что таблицы в стиле APA нумеруются последовательно, начиная с 1 (таблица 1, таблица 2 и т. д.), и имеют краткие, но ясные и описательные заголовки.


Рисунок 12.15 Пример таблицы в стиле APA, в которой представлены средние значения и стандартные отклонения



Еще одно распространенное использование таблиц — представление корреляций — обычно измеряемых с помощью r Пирсона — между несколькими переменными. Это называется корреляционной матрицей . Рисунок 12.16 «Пример таблицы в стиле APA (матрица корреляции) на основе исследования Маккейба и его коллег» — это матрица корреляции, основанная на исследовании Дэвида Маккейба и его коллег (McCabe, Roediger, McDaniel, Balota, & Hambrick, 2010). Маккейб, Д.П., Редигер, Х.Л., Макдэниел, М.А., Балота, Д.А., и Хамбрик, Д.З. (2010). Взаимосвязь между объемом рабочей памяти и исполнительным функционированием. Нейропсихология, 243 , 222–243.Их интересовали отношения между рабочей памятью и некоторыми другими переменными. Из таблицы видно, что корреляция между рабочей памятью и исполнительной функцией, например, была чрезвычайно сильной 0,96, что корреляция между рабочей памятью и словарным запасом была средней 0,27 и что все показатели, кроме словарного запаса, имеют тенденцию к снижению. с возрастом. Обратите внимание, что заполнена только половина таблицы, потому что другая половина будет иметь идентичные значения. Например, значение r Пирсона в правом верхнем углу (рабочая память и возраст) будет таким же, как и в левом нижнем углу (возраст и рабочая память). Корреляция переменной сама с собой всегда равна 1,00, поэтому эти значения заменены тире, чтобы облегчить чтение таблицы.


Рисунок 12.16 Пример таблицы в стиле APA (матрица корреляции), основанный на исследовании Маккейба и его коллег



Как и в случае с графиками, точные статистические результаты, приведенные в таблице, необязательно повторять в тексте. Вместо этого автор может отметить основные тенденции и предупредить читателя о деталях (например, конкретных корреляциях), которые представляют особый интерес.


КЛЮЧЕВЫЕ ВЫВОДЫ

В статье в стиле APA простые результаты наиболее эффективно представлены в тексте, тогда как более сложные результаты наиболее эффективно представлены в виде графиков или таблиц.

Стиль АРА включает в себя несколько правил представления числовых результатов в тексте. К ним относятся использование слов только для чисел меньше 10, которые не представляют точных статистических результатов, и округление результатов до двух знаков после запятой с использованием слов (например, «среднее») в тексте и символов (например, « М ») в круглых скобках.

Стиль APA включает в себя несколько правил представления результатов в виде графиков и таблиц. Графики и таблицы должны добавлять информацию, а не повторяться, быть как можно более простыми и интерпретируемыми сами по себе с описательным заголовком (для графиков) или описательным заголовком (для таблиц).

УПРАЖНЕНИЕ

Практика. В классическом исследовании мужчины и женщины оценивали важность физической привлекательности как для краткосрочного, так и для долгосрочного партнера (Buss & Schmitt, 1993). Басс, Д.М., и Шмитт, Д.П. (1993). Теория сексуальных стратегий: контекстуальный эволюционный анализ человеческого спаривания. Психологический обзор, 100 , 204–232. Средние значения и стандартные отклонения следующие. Мужчины / Краткосрочные: M = 5,67, SD = 2,34; Мужчины/долгосрочные: M = 4,43, SD = 2,11; Женщины / краткосрочные: M = 5,67, SD = 2,48; Женщины / Долгий срок: M = 4,22, SD= 1,98. Представьте эти результаты (а) в письменной форме, (б) в виде графика и (в) в таблице.

12.4 Проведение анализов

ЗАДАЧА ОБУЧЕНИЯ

Опишите шаги, связанные с подготовкой и анализом типичного набора необработанных данных.

Даже когда вы понимаете, что касается статистики, анализ данных может быть сложным процессом. Вполне вероятно, что для каждого из нескольких участников имеются данные по нескольким различным переменным: демографические данные, такие как пол и возраст, одна или несколько независимых переменных, одна или несколько зависимых переменных и, возможно, проверка манипулирования. Более того, «сырые» (непроанализированные) данные могут принимать несколько различных форм — заполненные бумажно-карандашные вопросники, компьютерные файлы, заполненные цифрами или текстом, видео или письменные заметки, — и их, возможно, придется систематизировать, кодировать или комбинировать. каким-то образом. Могут быть даже отсутствующие, неправильные или просто «подозрительные» ответы, с которыми необходимо разобраться. В этом разделе мы рассмотрим некоторые практические советы, чтобы сделать этот процесс максимально организованным и эффективным.


Подготовьте данные для анализа

Независимо от того, находятся ли ваши необработанные данные на бумаге или в компьютерном файле (или в том и другом), есть несколько вещей, которые вы должны сделать, прежде чем приступить к их анализу. Во-первых, убедитесь, что они не содержат никакой информации, которая может идентифицировать отдельных участников, и убедитесь, что у вас есть безопасное место, где вы можете хранить данные, и отдельное безопасное место, где вы можете хранить любые формы согласия. Если данные не являются очень конфиденциальными, обычно достаточно запертой комнаты или защищенного паролем компьютера. Также рекомендуется делать фотокопии или резервные копии файлов ваших данных и хранить их в еще одном безопасном месте — по крайней мере, до завершения проекта. Профессиональные исследователи обычно хранят копии своих необработанных данных и форм согласия в течение нескольких лет на случай, если после завершения проекта возникнут вопросы о процедуре, данных или согласии участников.


Затем вы должны проверить свои необработанные данныечтобы убедиться, что они заполнены и выглядят точно записанными (будь то участники, вы сами или компьютерная программа, которая делала запись). На этом этапе вы можете обнаружить неразборчивые или отсутствующие ответы или явное недопонимание (например, ответ «12» по шкале от 1 до 10). Вам придется решить, достаточно ли серьезны такие проблемы, чтобы сделать данные участника непригодными для использования. Если информация об основной независимой или зависимой переменной отсутствует, или если несколько ответов отсутствуют или вызывают подозрения, возможно, вам придется исключить данные этого участника из анализа. Если вы решите исключить какие-либо данные, не выбрасывайте и не удаляйте их, потому что вы или другой исследователь можете захотеть просмотреть их позже. Вместо,


Теперь вы готовы ввести свои данные в программу для работы с электронными таблицами или, если они уже есть в компьютерном файле, отформатировать их для анализа. Для создания файла данных можно использовать обычную программу для работы с электронными таблицами, например Microsoft Excel, или программу статистического анализа, например SPSS . (Файлы данных, созданные в одной программе, обычно можно преобразовать для работы с другими программами.) Наиболее распространенный формат: каждая строка представляет участника, а каждый столбец представляет переменную (с именем переменной вверху каждого столбца). . Пример файла данных показан в таблице 12.6 «Пример файла данных».. Первый столбец содержит идентификационные номера участников. Затем следуют столбцы, содержащие демографическую информацию (пол и возраст), независимые переменные (настроение, четыре элемента самооценки и общее количество четырех элементов самооценки) и, наконец, зависимые переменные (намерения и установки). Категориальные переменные обычно можно вводить в виде меток категорий (например, «М» и «Ж» для мужчин и женщин) или в виде чисел (например, «0» для отрицательного настроения и «1» для положительного настроения). Хотя метки категорий часто более четкие, для некоторых анализов могут потребоваться числа. SPSS позволяет вам вводить числа, а также прикреплять к каждому числу метку категории.


Таблица 12.6 Пример файла данных


Я БЫ СЕКС ВОЗРАСТ НАСТРОЕНИЕ SE1 SE2 SE3 SE4 ОБЩИЙ INT АТТ

1 М 20 1 2 3 2 3 10 6 5

2 Ф 22 1 1 0 2 1 4 4 4

3 Ф 19 0 2 2 2 2 8 2 3

4 Ф 24 0 3 3 2 3 11 5 6

Если у вас есть критерии множественного ответа — например, показатель самооценки в Таблице 12.6 «Пример файла данных» , — вы можете комбинировать элементы вручную, а затем ввести общий балл в свою электронную таблицу. Однако намного лучше вводить каждый ответ как отдельную переменную в электронную таблицу — как в случае показателя самооценки в Таблице 12.6 «Файл с примерными данными» — и использовать программное обеспечение для их объединения (например, с помощью функции «СРЕДНЯЯ»). в Excel или функцию «Вычислить» в SPSS). Этот подход не только более точен, но и позволяет обнаруживать и исправлять ошибки, оценивать внутреннюю согласованность и анализировать отдельные ответы, если вы решите сделать это позже.


Предварительные анализы

Прежде чем перейти к основным вопросам исследования, часто необходимо провести несколько предварительных анализов. Для мер с множественными ответами следует оценить внутреннюю согласованность меры. Статистические программы, такие как SPSS, позволят вам вычислить α Кронбаха или κ Коэна. Если это выходит за рамки вашего уровня комфорта, вы все равно можете вычислить и оценить корреляцию с разделением пополам.


Далее следует проанализировать каждую важную переменную отдельно. (Конечно, это не обязательно для управляемых независимых переменных, потому что вы, как исследователь, определили, каким будет распределение.) Составьте гистограммы для каждой из них, отметьте их форму и вычислите общие показатели центральной тенденции и изменчивости. Убедитесь, что вы понимаете, что означают эти статистические данные с точки зрения интересующих вас переменных. Например, распределение самооценки счастья по шкале от 1 до 10 может быть унимодальным и иметь отрицательную асимметрию со средним значением 8,25. и стандартное отклонение 1,14. Но это означает , что большинство участников оценили себя довольно высоко по шкале счастья, а небольшое число оценило себя заметно ниже.


Настало время выявить выбросы, изучить их более внимательно и решить, что с ними делать. Вы можете обнаружить, что то, что на первый взгляд кажется выбросом, является результатом неправильного ввода ответа в файл данных, и в этом случае вам нужно только исправить файл данных и двигаться дальше. В качестве альтернативы вы можете подозревать, что выброс представляет собой какую-то другую ошибку, непонимание или отсутствие усилий со стороны участника. Например, в распределении времени реакции, в котором большинству участников потребовалось всего несколько секунд, чтобы ответить, участник, которому потребовалось 3 минуты, чтобы ответить, будет выбросом. Кажется вероятным, что этот участник не понял задание (или, по крайней мере, не обратил на него особого внимания). Кроме того, включение его или ее времени реакции окажет большое влияние на среднее значение и стандартное отклонение для выборки. В подобных ситуациях может быть оправданным исключение из анализа второстепенного ответа или участника. Однако если вы сделаете это, вам следует вести записи о том, какие ответы или участников вы исключили и почему, и последовательно применять те же критерии к каждому ответу и каждому участнику. Когда вы представляете свои результаты, вы должны указать, сколько ответов или участников вы исключили, а также конкретные критерии, которые вы использовали. И опять же, не выбрасывайте и не удаляйте данные, которые вы решили исключить. Просто отложите их, потому что вы или другой исследователь можете захотеть просмотреть их позже. и последовательно применяйте те же самые критерии к каждому ответу и каждому участнику. Когда вы представляете свои результаты, вы должны указать, сколько ответов или участников вы исключили, а также конкретные критерии, которые вы использовали. И опять же, не выбрасывайте и не удаляйте данные, которые вы решили исключить. Просто отложите их, потому что вы или другой исследователь можете захотеть просмотреть их позже. и последовательно применяйте те же самые критерии к каждому ответу и каждому участнику. Когда вы представляете свои результаты, вы должны указать, сколько ответов или участников вы исключили, а также конкретные критерии, которые вы использовали. И опять же, не выбрасывайте и не удаляйте данные, которые вы решили исключить. Просто отложите их, потому что вы или другой исследователь можете захотеть просмотреть их позже.


Имейте в виду, что выбросы не обязательно означают ошибку, непонимание или недостаток усилий. Они могут представлять действительно экстремальные ответы или участников. Например, в одной большой выборке студентов колледжа подавляющее большинство участников сообщили, что у них было менее 15 сексуальных партнеров, но также было несколько крайних значений 60 или 70 (Brown & Sinclair, 1999). Браун, Н.Р., и Синклер, Р.К. (1999). Оценка количества сексуальных партнеров в течение жизни: мужчины и женщины делают это по-разному. Журнал сексуальных исследований, 36 , 292–297.Хотя эти оценки могут отражать ошибки, недоразумения или даже преднамеренные преувеличения, вполне вероятно, что они представляют собой честные и даже точные оценки. Одной из стратегий здесь было бы использование медианы и других статистических данных, на которые не сильно влияют выбросы. Другой вариант — проанализировать данные, включая и исключая любые выбросы. Если результаты в основном совпадают, что часто бывает, то имеет смысл оставить выбросы. Если результаты различаются в зависимости от того, включены или исключены выбросы, то можно представить оба анализа и обсудить различия между ними.


Ответьте на вопросы исследования

Наконец, вы готовы ответить на основные вопросы исследования. Если вас интересует разница между средними значениями группы или условия, вы можете вычислить соответствующие средние значения группы или условия и стандартные отклонения, построить гистограмму для отображения результатов и вычислить d Коэна . Если вас интересует корреляция между количественными переменными, вы можете построить линейный график или диаграмму рассеяния (не забудьте проверить на нелинейность и ограничение диапазона) и вычислить r Пирсона .


На этом этапе вы также должны изучить свои данные на предмет других интересных результатов, которые могут стать основой для будущих исследований (и материалом для раздела обсуждения вашей статьи). Дэрил Бем (2003) предполагает, что вы


[e]изучите [ваши данные] со всех сторон. Проанализируйте пол отдельно. Составьте новые составные индексы. Если данные предполагают новую гипотезу, попытайтесь найти дополнительные доказательства в других местах данных. Если вы видите смутные следы интересных закономерностей, попробуйте реорганизовать данные, чтобы сделать их более рельефными. Если есть участники, которые вам не нравятся, или испытания, наблюдатели или интервьюеры, которые дали вам аномальные результаты, исключите их (временно). Отправляйтесь на рыбалку за чем-нибудь — чем угодно — интересным. (стр. 186–187) Бем, DJ (2003). Написание статьи для эмпирического журнала. В JM Darley, MP Zanna и HL Roediger III (Eds.), The compleat Academic: A Career Guide (2-е изд., стр. 185–219). Вашингтон, округ Колумбия: Американская психологическая ассоциация.


Однако важно быть осторожным, потому что сложные наборы данных, скорее всего, будут включать «паттерны», возникшие совершенно случайно. Таким образом, результаты, обнаруженные во время «рыбалки», должны быть воспроизведены по крайней мере в одном новом исследовании, прежде чем они будут представлены как самостоятельные новые явления.


Поймите свою описательную статистику

В следующей главе мы рассмотрим статистику логического вывода — набор методов, позволяющих решить, применимы ли результаты вашей выборки к генеральной совокупности. Хотя статистика выводов важна по причинам, которые мы вскоре объясним, начинающие исследователи иногда забывают, что их описательная статистика действительно говорит о том, «что произошло» в их исследовании. Например, представьте, что группа лечения из 50 участников имеет средний балл 34,32 ( SD = 10,45), контрольная группа из 50 участников имеет средний балл 21,45 ( SD = 9,22), а d Коэна составляет чрезвычайно сильное значение 1,31. Хотя проведение и отчетность по статистике логического вывода (например, ттест), безусловно, будет обязательной частью любого официального отчета об этом исследовании, из одной только описательной статистики должно быть ясно, что лечение работает. Или представьте, что диаграмма рассеяния показывает нечеткое «облако» точек, а r Пирсона равно тривиальному —0,02. Опять же, несмотря на то, что проведение и отчетность по логической статистике были бы обязательной частью любого официального отчета об этом исследовании, из одной только описательной статистики должно быть ясно, что переменные по существу не связаны между собой. Дело в том, что вы всегда должны быть уверены, что сначала полностью понимаете свои результаты на описательном уровне, а затем переходите к выводной статистике.


КЛЮЧЕВЫЕ ВЫВОДЫ

Необработанные данные необходимо подготовить для анализа, проверив их на наличие возможных ошибок, упорядочив их и введя в программу электронных таблиц.

Предварительный анализ любого набора данных включает проверку надежности мер, оценку эффективности любых манипуляций, изучение распределений отдельных переменных и выявление выбросов.

Выбросы, которые кажутся результатом ошибки, непонимания или недостатка усилий, могут быть исключены из анализа. Критерии исключенных ответов или участников должны применяться одинаково ко всем данным и описываться при представлении результатов. Исключенные данные следует откладывать, а не уничтожать или удалять на случай, если они потребуются позже.

Описательная статистика рассказывает историю того, что произошло в исследовании. Хотя выводная статистика также важна, важно сначала понять описательную статистику.

УПРАЖНЕНИЕ

Обсуждение: Каковы по крайней мере два разумных способа справиться с каждым из следующих выбросов на основе обсуждения в этой главе? (a) Участник, оценивающий рост обычных людей, оценивает рост одной женщины как «84 дюйма». (б) В исследовании памяти на обычные объекты один участник набрал 0 баллов из 15. (в) В ответ на вопрос о том, сколько у него «близких друзей», один участник пишет «32».





Выведенный статистика

Напомним, что Матиас Мель и его коллеги в своем исследовании половых различий в разговорчивости обнаружили, что женщины в их выборке произносили в среднем 16 215 слов в день, а мужчины — в среднем 15 669 слов в день (Мель, Вазире, Рамирес-Эспарса). , Слэтчер и Пеннебейкер, 2007 г.). Мел, М.Р., Вазире, С., Рамирес-Эспарса, Н., Слэтчер, Р.Б., и Пеннебейкер, Дж.В. (2007). Действительно ли женщины более разговорчивы, чем мужчины? Наука , 317 , 82.Но, несмотря на эти половые различия в их выборке, они пришли к выводу, что не было доказательств половых различий в разговорчивости среди населения. Вспомним также, что Аллен Каннер и его коллеги, изучая взаимосвязь между ежедневными неприятностями и симптомами, обнаружили в своей выборке корреляцию +0,60 (Kanner, Coyne, Schaefer, & Lazarus, 1981). Каннер, А. Д., Койн, Дж. К., Шефер, К., и Лазарус, Р. С. (1981). Сравнение двух режимов измерения стресса: ежедневные неприятности и подъемы по сравнению с крупными жизненными событиями. Журнал поведенческой медицины , 4 , 1–39. Но они пришли к выводу, что это означает , чтовзаимосвязь между неприятностями и симптомами в популяции. Это поднимает вопрос о том, как исследователи могут сказать, отражает ли результат их выборки что-то, что верно для населения.


Ответ на этот вопрос заключается в том, что они используют набор методов, называемых статистикой вывода, о чем и пойдет речь в этой главе. Мы сосредоточимся, в частности, на проверке нулевой гипотезы, наиболее распространенном подходе к выводной статистике в психологических исследованиях. Мы начнем с концептуального обзора проверки нулевой гипотезы, включая ее цель и основную логику. Затем мы рассмотрим несколько методов проверки нулевой гипотезы, чтобы сделать выводы о различиях между средними значениями и о корреляциях между количественными переменными. Наконец, мы рассмотрим несколько других важных идей, связанных с проверкой нулевой гипотезы, включая те, которые могут быть полезны при планировании новых исследований и интерпретации результатов. Мы также рассмотрим некоторые давние критические замечания в отношении проверки нулевых гипотез и некоторые способы борьбы с этими критическими замечаниями.


13.1 Понимание проверки нулевой гипотезы

ЦЕЛИ ОБУЧЕНИЯ

Объясните цель проверки нулевой гипотезы, включая роль ошибки выборки.

Опишите базовую логику проверки нулевой гипотезы.

Опишите роль силы взаимосвязи и размера выборки в определении статистической значимости и сделайте разумные суждения о статистической значимости на основе этих двух факторов.

Цель проверки нулевой гипотезы

Как мы видели, психологические исследования обычно включают измерение одной или нескольких переменных для выборки и вычисление описательной статистики для этой выборки. Однако в целом цель исследователя состоит не в том, чтобы сделать выводы об этой выборке, а в том, чтобы сделать выводы о совокупности, из которой была отобрана выборка. Таким образом, исследователи должны использовать выборочную статистику, чтобы сделать выводы о соответствующих значениях в популяции. Эти соответствующие значения в совокупности называются параметрами. Представьте, например, что исследователь измеряет количество симптомов депрессии у каждого из 50 взрослых с клинической депрессией и вычисляет среднее количество симптомов. Исследователь, вероятно, хочет использовать эту выборочную статистику (среднее количество симптомов для выборки), чтобы сделать выводы о соответствующем параметре популяции (среднее количество симптомов у взрослых с клинической депрессией).


К сожалению, выборочная статистика не является идеальной оценкой соответствующих параметров совокупности. Это связано с тем, что существует определенная доля случайной изменчивости в любой статистике от выборки к выборке. Среднее количество депрессивных симптомов может быть 8,73 в одной выборке взрослых с клинической депрессией, 6,45 во второй выборке и 9,44 в третьей, даже если эти выборки выбраны случайным образом из одной и той же популяции. Точно так же корреляция ( r Пирсона ) между двумя переменными может составлять +,24 в одной выборке, -0,04 во второй выборке и +,15 в третьей — опять же, даже если эти выборки выбираются случайным образом из одной и той же совокупности. Эта случайная изменчивость статистики от выборки к выборке называется ошибкой выборки . (Обратите внимание, что термин ошибказдесь относится к случайной изменчивости и не означает, что кто-то сделал ошибку. Никто не «совершает ошибку выборки».)


Одним из следствий этого является то, что при наличии статистической взаимосвязи в выборке не всегда ясно, существует ли статистическая взаимосвязь в генеральной совокупности. Небольшая разница между средними значениями двух групп в выборке может указывать на наличие небольшой разницы между средними значениями двух групп в совокупности. Но также может быть так, что между средними значениями в генеральной совокупности нет разницы, а разница в выборке — это всего лишь ошибка выборки. Точно так же значение r Пирсона, равное -0,29 в выборке, может означать, что в популяции существует отрицательная связь. Но также может быть и так, что в популяции нет связи, а связь в выборке — это всего лишь ошибка выборки.


Фактически любую статистическую связь в выборке можно интерпретировать двояко:


В популяции существует связь, и связь в выборке это отражает.

В генеральной совокупности связи нет, а связь в выборке отражает только ошибку выборки.

Цель проверки нулевой гипотезы — просто помочь исследователям сделать выбор между этими двумя интерпретациями.


Логика проверки нулевой гипотезы

Проверка нулевой гипотезы — это формальный подход к выбору между двумя интерпретациями статистической взаимосвязи в выборке. Одна интерпретация называется нулевой гипотезой (часто обозначается символом H 0 и читается как «H-ноль»). Это идея о том, что в генеральной совокупности нет взаимосвязи и что взаимосвязь в выборке отражает только ошибку выборки. Неформально нулевая гипотеза состоит в том, что выборочные отношения «возникли случайно». Другая интерпретация называется альтернативной гипотезой (часто обозначаемой как H 1 ). Это идея о том, что в популяции существует взаимосвязь и что взаимосвязь в выборке отражает эту взаимосвязь в популяции.


Опять же, каждое статистическое отношение в выборке можно интерпретировать одним из следующих двух способов: оно могло возникнуть случайно или могло отражать отношение в популяции. Поэтому исследователям нужен способ сделать выбор между ними. Хотя существует множество конкретных методов проверки нулевой гипотезы, все они основаны на одной и той же общей логике. Шаги следующие:


Предположим на данный момент, что нулевая гипотеза верна. Между переменными в популяции нет связи.

Определите, насколько вероятными были бы выборочные отношения, если бы нулевая гипотеза была верна.

Если выборочная взаимосвязь крайне маловероятна, отклоните нулевую гипотезу в пользу альтернативной гипотезы. Если это не будет крайне маловероятным, то сохраните нулевую гипотезу .

Следуя этой логике, мы можем начать понимать, почему Мель и его коллеги пришли к выводу, что в популяции нет разницы в разговорчивости между женщинами и мужчинами. По сути, они задавали следующий вопрос: «Если бы не было различий в популяции, насколько вероятно, что мы нашли бы небольшую разницу d?= 0,06 в нашей выборке?» Их ответ на этот вопрос заключался в том, что эта выборочная связь была бы достаточно вероятной, если бы нулевая гипотеза была верна. Поэтому они сохранили нулевую гипотезу, сделав вывод об отсутствии доказательств половых различий в популяции. Мы также можем понять, почему Каннер и его коллеги пришли к выводу, что существует корреляция между неприятностями и симптомами среди населения. Они спросили: «Если нулевая гипотеза верна, насколько вероятно, что мы обнаружим сильную корреляцию +,60 в нашей выборке?» Их ответ на этот вопрос заключался в том, что эта выборочная связь была бы довольно маловероятной, если бы нулевая гипотеза была верна. Поэтому они отклонили нулевую гипотезу в пользу альтернативной гипотезы, сделав вывод о наличии положительной корреляции между этими переменными в популяции.


Важным шагом в проверке нулевой гипотезы является определение вероятности результата выборки, если нулевая гипотеза верна. Эта вероятность называется значением p . Низкое значение p означает, что результат выборки был бы маловероятным, если бы нулевая гипотеза была верна, и приводит к отклонению нулевой гипотезы. Высокое значение p означает, что результат выборки был бы вероятным, если бы нулевая гипотеза была верна, и приводит к сохранению нулевой гипотезы. Но насколько низким должно быть значение p , чтобы результат выборки считался достаточно маловероятным, чтобы отвергнуть нулевую гипотезу? При проверке нулевой гипотезы этот критерий называется α (альфа)и почти всегда устанавливается на 0,05. Если вероятность того, что результат будет таким же экстремальным, как результат выборки, составляет менее 5%, если нулевая гипотеза верна, то нулевая гипотеза отклоняется. Когда это происходит, говорят, что результат является статистически значимым . Если вероятность того, что нулевая гипотеза верна, составляет более 5%, что результат будет таким же экстремальным, как и результат выборки, нулевая гипотеза сохраняется. Это не обязательно означает, что исследователь принимает нулевую гипотезу как истинную — только то, что в настоящее время недостаточно доказательств, чтобы сделать вывод, что она верна. Исследователи часто используют выражение «не отвергнуть нулевую гипотезу», а не «сохранить нулевую гипотезу», но они никогда не используют выражение «принять нулевую гипотезу».


Неправильно понятое значение p

Величина р — одна из самых неправильно понимаемых величин в психологических исследованиях (Cohen, 1994). Коэн, Дж. (1994). Мир круглый: p < 0,05. Американский психолог, 49 , 997–1003. Даже профессиональные исследователи неверно истолковывают его, и нередко такие неверные толкования появляются в учебниках по статистике!


Наиболее распространенное неправильное истолкование состоит в том, что значение p — это вероятность того, что нулевая гипотеза верна, то есть результат выборки появился случайно. Например, заблуждающийся исследователь может сказать, что, поскольку значение p равно 0,02, вероятность того, что результат получен случайно, составляет всего 2%, а вероятность того, что он отражает реальные отношения в популяции, составляет 98%. Но это неправильно . Значение p на самом деле представляет собой вероятность результата, по крайней мере столь же экстремального, как результат выборки , если бы нулевая гипотеза была верна. Таким образом, значение p , равное 0,02, означает, что если бы нулевая гипотеза была верна, такой экстремальный результат выборки возник бы только в 2% случаев.


Вы можете избежать этого недоразумения, если вспомните, что значение p не является вероятностью того, что какая-либо конкретная гипотеза верна или ложна. Вместо этого это вероятность получения результата выборки , если нулевая гипотеза верна.


Роль размера выборки и силы связи

Напомним, что проверка нулевой гипотезы включает в себя ответ на вопрос: «Если нулевая гипотеза верна, какова вероятность того, что выборка окажется столь же экстремальной?» Другими словами, «Каково значение p ?» Может быть полезно увидеть, что ответ на этот вопрос зависит всего от двух соображений: силы связи и размера выборки. В частности, чем сильнее выборочная связь и чем больше выборка, тем менее вероятным будет результат, если нулевая гипотеза верна. То есть, чем ниже значение p . Это должно иметь смысл. Представьте себе исследование, в котором выборка из 500 женщин сравнивается с выборкой из 500 мужчин с точки зрения какой-либо психологической характеристики, и d Коэнасильный 0,50. Если бы в популяции действительно не было половых различий, то такой сильный результат, основанный на такой большой выборке, должен казаться маловероятным. Теперь представьте себе аналогичное исследование, в котором выборка из трех женщин сравнивается с выборкой из трех мужчин, и d Коэна составляет слабое значение 0,10. Если бы в популяции не было половых различий, то такая слабая связь, основанная на такой небольшой выборке, должна казаться вероятной. И именно поэтому нулевая гипотеза будет отвергнута в первом примере и сохранена во втором.


Конечно, иногда результат может быть слабым, а выборка большой, или результат может быть сильным, а выборка маленькой. В этих случаях два соображения компенсируют друг друга, так что слабый результат может быть статистически значимым, если выборка достаточно велика, а сильная связь может быть статистически значимой, даже если выборка мала. Таблица 13.1 «Как сила связи и размер выборки в сочетании определяют, является ли результат статистически значимым»примерно показывает, как сочетаются сила связи и размер выборки, чтобы определить, является ли результат выборки статистически значимым. Столбцы таблицы представляют три уровня силы отношений: слабый, средний и сильный. Строки представляют четыре размера выборки, которые можно считать малыми, средними, большими и очень большими в контексте психологических исследований. Таким образом, каждая ячейка в таблице представляет собой сочетание силы связи и размера выборки. Если ячейка содержит слово Yes , то эта комбинация будет статистически значимой как для d Коэна, так и для r Пирсона . Если оно содержит слово « Нет », то оно не будет статистически значимым ни для одного из них. Есть одна ячейка, где решение для dи r будет другим, а также другим, где оно может отличаться в зависимости от некоторых дополнительных соображений, которые обсуждаются в Разделе 13.2 «Некоторые основные тесты нулевой гипотезы».


Таблица 13.1. Сочетание силы связи и размера выборки для определения того, является ли результат статистически значимым


Сила отношений

Размер образца Слабый Середина Сильный

Малый ( N = 20) Нет Нет

д = может быть


р = Да


Средний ( N = 50) Нет Да Да

Большой ( N = 100)

д = да


р = нет


Да Да

Очень большой ( N = 500) Да Да Да

Хотя Таблица 13.1 «Как сила связи и размер выборки сочетаются для определения того, является ли результат статистически значимым»дает только приблизительное руководство, оно очень ясно показывает, что слабые связи, основанные на средних или малых выборках, никогда не бывают статистически значимыми, а сильные связи, основанные на средних или больших выборках, всегда статистически значимы. Если вы будете помнить об этом, вы часто будете знать, является ли результат статистически значимым, основываясь только на описательной статистике. Чрезвычайно полезно иметь возможность развивать такого рода интуитивное суждение. Одна из причин заключается в том, что это позволяет вам формировать ожидания относительно того, какими будут результаты ваших формальных тестов нулевой гипотезы, что, в свою очередь, позволяет вам обнаруживать проблемы в ваших анализах. Например, если ваша выборочная взаимосвязь сильная, а ваша выборка средняя, ​​вы должны отклонить нулевую гипотезу. Если по какой-то причине ваш формальный тест нулевой гипотезы указывает на обратное, тогда вам нужно перепроверить свои расчеты и интерпретации. Вторая причина заключается в том, что способность делать такого рода интуитивные суждения указывает на то, что вы понимаете основную логику этого подхода в дополнение к способности выполнять вычисления.


Статистическая значимость против практической значимости

Таблица 13.1 «Как сила связи и размер выборки сочетаются для определения того, является ли результат статистически значимым» иллюстрирует еще один чрезвычайно важный момент. Статистически значимый результат не обязательно является сильным. Даже очень слабый результат может быть статистически значимым, если он основан на достаточно большой выборке. Это тесно связано с аргументом Джанет Шибли Хайд о половых различиях (Hyde, 2007). Хайд, Дж. С. (2007). Новые направления в изучении гендерных сходств и различий. Текущие направления в психологической науке , 16 , 259–263. Различия между женщинами и мужчинами в решении математических задач и лидерских способностях статистически значимы. Но слово значимоеможет заставить людей интерпретировать эти различия как сильные и важные — возможно, даже достаточно важные, чтобы влиять на курсы колледжа, которые они выбирают, или даже на то, за кого они голосуют. Однако, как мы видели, эти статистически значимые различия на самом деле весьма слабы — возможно, даже «тривиальны».


Вот почему важно различать статистическую значимость результата и практическую значимость этого результата. Практическая значимостьотносится к важности или полезности результата в некотором реальном контексте. Многие половые различия статистически значимы и даже могут представлять интерес с чисто научной точки зрения, но они не имеют практического значения. В клинической практике это же понятие часто называют «клинической значимостью». Например, исследование нового метода лечения социальной фобии может показать, что он дает статистически значимый положительный эффект. Тем не менее, этот эффект все еще может быть недостаточно сильным, чтобы оправдать время, усилия и другие затраты на его применение на практике, особенно если более простые и дешевые методы лечения, которые работают почти так же хорошо, уже существуют. Хотя этот результат является статистически значимым, можно сказать, что он не имеет практического или клинического значения.


КЛЮЧЕВЫЕ ВЫВОДЫ

Проверка нулевой гипотезы — это формальный подход к решению вопроса о том, отражает ли статистическая взаимосвязь в выборке реальную взаимосвязь в популяции или это просто случайность.

Логика проверки нулевой гипотезы включает в себя предположение, что нулевая гипотеза верна, определение того, насколько вероятным был бы результат выборки, если бы это предположение было правильным, а затем принятие решения. Если результат выборки был бы маловероятным, если бы нулевая гипотеза была верна, то он отклоняется в пользу альтернативной гипотезы. Если это не маловероятно, то нулевая гипотеза сохраняется.

Вероятность получения результата выборки, если нулевая гипотеза верна ( значение p ), основана на двух соображениях: силе связи и размере выборки. Разумные суждения о том, являются ли выборочные отношения статистически значимыми, часто можно сделать, быстро рассмотрев эти два фактора.

Статистическая значимость — это не то же самое, что сила или важность отношений. Даже слабые отношения могут быть статистически значимыми, если размер выборки достаточно велик. Важно учитывать силу связи и практическую значимость результата в дополнение к его статистической значимости.

УПРАЖНЕНИЯ

Обсуждение: представьте себе исследование, показывающее, что люди, которые едят больше брокколи, как правило, счастливее. Объясните человеку, ничего не смыслящему в статистике, зачем исследователи проводят проверку нулевой гипотезы.

Практика: Используйте Таблицу 13.1 «Как сила связи и размер выборки сочетаются для определения того, является ли результат статистически значимым» , чтобы решить, является ли каждый из следующих результатов статистически значимым.


Корреляция между двумя переменными составляет r = -0,78 на основе размера выборки 137.

Средний балл по психологической характеристике для женщин составляет 25 ( SD = 5), а средний балл для мужчин — 24 ( SD = 5). В исследовании приняли участие 12 женщин и 10 мужчин.

В эксперименте на память среднее количество элементов, которое вспомнили 40 участников в состоянии А, было на 0,50 стандартного отклонения больше, чем среднее число, которое вспомнили 40 участников в состоянии Б.

В другом эксперименте с памятью средние баллы участников в условиях А и В оказались абсолютно одинаковыми!

Учащийся находит корреляцию r = 0,04 между количеством единиц, которые учащиеся изучают в его классе методов исследования, и уровнем стресса учащихся.

13.2 Некоторые основные тесты нулевой гипотезы

ЦЕЛИ ОБУЧЕНИЯ

Проведение и интерпретация одновыборочных, зависимых и независимых выборок t - тестов.

Интерпретируйте результаты односторонних, повторных измерений и факторного ANOVA.

Проведите и интерпретируйте тесты нулевой гипотезы r Пирсона .

В этом разделе мы рассмотрим несколько распространенных процедур проверки нулевой гипотезы. Акцент здесь делается на предоставлении достаточного количества информации, чтобы позволить вам проводить и интерпретировать самые основные версии. В большинстве случаев онлайн-инструменты статистического анализа, упомянутые в главе 12 «Описательная статистика» , справятся с вычислениями, как и такие программы, как Microsoft Excel и SPSS.


Т - тест

Как мы видели на протяжении всей этой книги, многие исследования в области психологии сосредоточены на различии между двумя средствами. Наиболее распространенным тестом нулевой гипотезы для этого типа статистической взаимосвязи является t - критерий . В этом разделе мы рассмотрим три типа t -критерия, которые используются для несколько разных планов исследования: t-критерий для одной выборки , t - критерий для зависимых выборок и t - критерий для независимых выборок .


Одновыборочный t - критерий

Одновыборочный t - критерий используется для сравнения среднего значения выборки ( M ) с гипотетическим средним значением совокупности (μ 0 ), что обеспечивает некоторый интересный стандарт сравнения. Нулевая гипотеза состоит в том, что среднее значение для совокупности (µ) равно гипотетическому среднему значению для совокупности: µ = µ 0 . Альтернативная гипотеза состоит в том, что среднее значение для совокупности отличается от гипотетического среднего значения для совокупности: μ ≠ μ 0 . Чтобы сделать выбор между этими двумя гипотезами, нам нужно найти вероятность получения выборочного среднего (или еще одного экстремального), если нулевая гипотеза верна. Но для нахождения этого значения p требуется сначала вычислить тестовую статистику, называемую t .. ( Тестовая статистика — это статистика, которая вычисляется только для того, чтобы помочь найти значение p .) Формула для t выглядит следующим образом:



Опять же, M — выборочное среднее, а µ 0 — гипотетическое среднее интересующей совокупности. SD — это стандартное отклонение выборки, а N — размер выборки.


Причина, по которой t - статистика (или любая тестовая статистика) полезна, заключается в том, что мы знаем, как она распределяется, когда нулевая гипотеза верна. Как показано на рис. 13.1 «Распределение» , это распределение унимодальное и симметричное, а его среднее значение равно 0. Его точная форма зависит от статистического понятия, называемого степенями свободы, которые для одновыборочного t - критерия равны N — 1. (Существует 24 степени свободы для распределения, показанного на рис. 13.1 «Распределение» .) Важным моментом является то, что знание этого распределения позволяет найти значение p для любого показателя t . Рассмотрим, например, тбалл +1,50 на основе выборки из 25. Вероятность t - балла, по крайней мере, этого экстремального значения определяется долей t - баллов в распределении, которые являются, по крайней мере, этим экстремальным. А пока давайте определим экстремум как далекий от нуля в любом направлении. Таким образом, значение p представляет собой долю t - показателей, которые составляют +1,50 или выше или -1,50 или ниже — значение, которое оказывается равным 0,14.


Рис. 13.1 Распределение t - оценок (с 24 степенями свободы), когда нулевая гипотеза верна



Красные вертикальные линии представляют двусторонние критические значения, а зеленые вертикальные линии — односторонние критические значения при α = 0,05.


К счастью, нам не нужно иметь дело непосредственно с распределением t - показателей. Если бы мы ввели наши выборочные данные и гипотетическое среднее интереса в один из статистических онлайн-инструментов в главе 12 «Описательная статистика» или в такую ​​программу, как SPSS (в Excel нет функции одновыборочного t - теста), результат был бы таким: включают как t - показатель, так и значение p . На этом этапе остальная часть процедуры проста. Если p меньше 0,05, мы отклоняем нулевую гипотезу и делаем вывод, что среднее значение генеральной совокупности отличается от гипотетического среднего интереса. Если рбольше 0,05, мы сохраняем нулевую гипотезу и заключаем, что недостаточно доказательств, чтобы сказать, что среднее значение генеральной совокупности отличается от гипотетического среднего интереса. (Опять же, технически мы заключаем только, что у нас недостаточно доказательств, чтобы заключить, что оно действительно отличается.)


Если бы нам нужно было вычислить показатель t вручную, мы могли бы использовать для принятия решения таблицу, подобную таблице 13.2 «Таблица критических значений» . В этой таблице не указаны фактические значения p . Вместо этого он предоставляет критические значения t для различных степеней свободы ( df) , когда α равно 0,05. А пока давайте сосредоточимся на двухсторонних критических значениях в последнем столбце таблицы. Каждое из этих значений следует интерпретировать как пару значений: одно положительное и одно отрицательное. Например, двусторонние критические значения при 24 степенях свободы составляют +2,064 и -2,064. Они представлены красными вертикальными линиями на рис. 13.1 «Распределение».. Идея состоит в том, что любой t -показатель ниже нижнего критического значения (левая красная линия на рис. 13.1 «Распределение» ) относится к нижним 2,5% распределения, в то время как любой t -показатель выше верхнего критического значения (правая ручная красная линия) находится в верхних 2,5% распределения. Это означает, что любая t -оценка, превышающая критическое значение в любом направлении, находится в самых крайних 5% t - оценок, когда нулевая гипотеза верна, и, следовательно, имеет значение p менее 0,05. Таким образом, если вычисляемый нами показатель t превышает критическое значение в любом направлении, мы отклоняем нулевую гипотезу. Если тоценка, которую мы вычисляем, находится между верхним и нижним критическими значениями, тогда мы сохраняем нулевую гипотезу.


Таблица 13.2 Таблица критических значений t при α = 0,05


Критическое значение

дф Однохвостый Двухвостый

3 2,353 3.182

4 2.132 2,776

5 2,015 2,571

6 1,943 2,447

7 1,895 2,365

8 1.860 2.306

9 1,833 2,262

10 1,812 2,228

11 1,796 2.201

12 1,782 2,179

13 1,771 2.160

14 1,761 2,145

15 1,753 2.131

16 1,746 2.120

17 1.740 2.110

18 1,734 2.101

19 1,729 2.093

20 1,725 2.086

21 1,721 2.080

22 1,717 2.074

23 1,714 2,069

24 1,711 2.064

25 1,708 2.060

30 1,697 2.042

35 1.690 2.030

40 1,684 2.021

45 1,679 2,014

50 1,676 2.009

60 1,671 2.000

70 1,667 1,994

80 1,664 1.990

90 1,662 1,987

100 1,660 1,984

До сих пор мы рассматривали так называемый двусторонний тест , в котором мы отклоняем нулевую гипотезу, если показатель t для выборки является экстремальным в любом направлении. Это имеет смысл, когда мы считаем, что среднее значение выборки может отличаться от гипотетического среднего значения генеральной совокупности, но у нас нет веских оснований ожидать, что эта разница пойдет в определенном направлении. Но также можно выполнить односторонний тест , в котором мы отклоняем нулевую гипотезу только в том случае, если показатель t для выборки является экстремальным в одном направлении, которое мы указываем перед сбором данных. Это имеет смысл, когда у нас есть веские основания ожидать, что среднее значение выборки будет отличаться от гипотетического среднего значения генеральной совокупности в определенном направлении.


Вот как это работает. Каждое одностороннее критическое значение в таблице 13.2 «Таблица критических значений» можно снова интерпретировать как пару значений: одно положительное и одно отрицательное. Показатель t ниже нижнего критического значения соответствует 5% самых низких значений распределения, а показатель t выше верхнего критического значения соответствует 5% самых высоких значений распределения. Для 24 степеней свободы эти значения составляют −1,711 и +1,711. (Они представлены зелеными вертикальными линиями на рисунке 13.1 «Распределение».) Однако для одностороннего теста мы должны решить перед сбором данных, ожидаем ли мы, что среднее значение выборки будет ниже, чем среднее значение гипотетической совокупности, и в этом случае мы будем использовать только более низкое критическое значение, или мы ожидаем, что среднее значение выборки быть больше, чем гипотетическое среднее значение населения, и в этом случае мы будем использовать только верхнее критическое значение. Обратите внимание, что мы по-прежнему отклоняем нулевую гипотезу, когда t - показатель для нашей выборки находится в самых крайних 5% t-показателей, которые мы ожидали бы, если бы нулевая гипотеза была верна, поэтому α остается на уровне 0,05. Мы просто переопределили крайниеотноситься только к одному хвосту распределения. Преимущество одностороннего теста состоит в том, что критические значения менее экстремальны. Если среднее значение выборки отличается от гипотетического среднего значения генеральной совокупности в ожидаемом направлении, то у нас больше шансов отклонить нулевую гипотезу. Недостатком является то, что если среднее значение выборки отличается от гипотетического среднего значения генеральной совокупности в неожиданном направлении, то нет никаких шансов отвергнуть нулевую гипотезу.


Пример одновыборочного t - критерия

Представьте, что психолога, занимающегося вопросами здоровья, интересует точность оценки студентов колледжа количества калорий в печенье с шоколадной крошкой. Он показывает печенье выборке из 10 студентов и просит каждого оценить количество калорий в нем. Поскольку фактическое количество калорий в печенье равно 250, это гипотетическое среднее интересующей совокупности (µ 0 ). Нулевая гипотеза состоит в том, что средняя оценка для населения (μ) равна 250. Поскольку у него нет реального представления о том, будут ли студенты недооценивать или переоценивать количество калорий, он решает провести двусторонний тест. Теперь представьте себе, что фактические оценки участников таковы:


250, 280, 200, 150, 175, 200, 200, 220, 180, 250.

Средняя оценка для образца ( M ) составляет 212,00 калорий, а стандартное отклонение ( SD ) составляет 39,17. Психолог теперь может вычислить t - показатель для своей выборки:



Если он введет данные в один из онлайн-инструментов анализа или воспользуется SPSS, он также сообщит ему, что двустороннее значение p для этого показателя t (с 10 − 1 = 9 степенями свободы) равно 0,013. Поскольку это значение меньше 0,05, психолог в области здравоохранения отклонит нулевую гипотезу и сделает вывод, что студенты колледжей склонны недооценивать количество калорий в печенье с шоколадной крошкой. Если он вычислит показатель t вручную, он может посмотреть в Таблицу 13.2 «Таблица критических значений» и увидеть, что критическое значение t для двустороннего критерия с 9 степенями свободы составляет ±2,262. Тот факт, что его показатель t был более экстремальным, чем это критическое значение, говорил бы ему, что его pзначение меньше 0,05 и что он должен отклонить нулевую гипотезу.


Наконец, если бы этот исследователь приступил к этому исследованию с серьезными основаниями ожидать, что студенты колледжа недооценивают количество калорий, то он мог бы провести односторонний тест вместо двустороннего. Единственное, что это изменит, — это критическое значение, которое будет равно −1,833. Это чуть менее экстремальное значение облегчило бы отклонение нулевой гипотезы. Однако если бы оказалось, что студенты колледжа переоценивают количество калорий — неважно, насколько сильно они его переоценивают, — исследователь не смог бы отвергнуть нулевую гипотезу.


Критерий зависимых выборок t

Критерий зависимых выборок (иногда называемый t - критерием парных выборок ) используется для сравнения двух средних значений для одного и того же образца, протестированного в два разных момента времени или в двух разных условиях . Это делает его подходящим для планов предварительного и последующего тестирования или экспериментов с участием испытуемых. Нулевая гипотеза состоит в том, что средние значения в два раза или при двух условиях одинаковы в популяции. Альтернативная гипотеза состоит в том, что они не одинаковы. Этот тест также может быть односторонним, если у исследователя есть веские основания ожидать, что разница пойдет в определенном направлении.


Это помогает думать о t-критерии зависимых выборок как о частном случае t-критерия одной выборки . Однако первым шагом в t -критерии зависимых выборок является сведение двух оценок каждого участника к единственной разностной оценке путем определения разницы между ними. В этот момент t - критерий зависимых выборок становится одновыборочным t - критерием для оценок различий. Гипотетическое среднее значение популяции (µ 0 ), представляющее интерес, равно 0, потому что это то, каким был бы показатель средней разности, если бы не было различий в среднем между двумя временами или двумя условиями. Теперь мы можем думать о нулевой гипотезе как о том, что средний показатель разницы в популяции равен 0 (µ0 = 0), а альтернативная гипотеза заключается в том, что средний балл различия в популяции не равен 0 (µ 0 ≠ 0).


Пример t -критерия зависимых выборок

Представьте, что медицинский психолог теперь знает, что люди склонны недооценивать количество калорий в нездоровой пище, и разработал короткую программу обучения, чтобы улучшить свои оценки. Чтобы проверить эффективность этой программы, он проводит предварительное и посттестовое исследование, в котором 10 участников оценивают количество калорий в шоколадном печенье перед тренировочной программой, а затем еще раз после нее. Поскольку он ожидает, что программа повысит оценки участников, он решает провести односторонний тест. Теперь представьте себе, что предварительные оценки равны


230, 250, 280, 175, 150, 200, 180, 210, 220, 190

и что посттестовые оценки (для тех же участников в том же порядке)


250, 260, 250, 200, 160, 200, 200, 180, 230, 240.

Таким образом, разница в баллах выглядит следующим образом:


+20, +10, -30, +25, +10, 0, +20, -30, +10, +50.

Обратите внимание, что не имеет значения, вычитается ли первый набор баллов из второго или второй из первого, если это делается одинаково для всех участников. В этом примере имеет смысл вычесть предварительные оценки из посттестовых оценок, чтобы положительные оценки разницы означали, что оценки выросли после обучения, а отрицательные оценки разницы означают, что оценки понизились.


Среднее значение различий составляет 8,50 со стандартным отклонением 27,27. Психолог здоровья теперь может вычислить t - показатель для своей выборки следующим образом:



Если он введет данные в один из онлайн-инструментов анализа или воспользуется Excel или SPSS, он сообщит ему, что одностороннее значение p для этого показателя t (опять же с 10 − 1 = 9 степенями свободы) равно 0,148. Поскольку это значение больше 0,05, он оставит нулевую гипотезу и сделает вывод, что тренировочная программа не увеличивает оценку калорийности людей. Если бы ему нужно было вычислить показатель t вручную, он мог бы взглянуть на Таблицу 13.2 «Таблица критических значений» и увидеть, что критическое значение t для одностороннего критерия с 9 степенями свободы равно +1,833. (На этот раз оно положительное, потому что он ожидал получить положительную разницу средних значений.) Тот факт, что его tоценка была менее экстремальной, чем это критическое значение сказало бы ему, что его значение p больше 0,05 и что он не должен отвергать нулевую гипотезу.


Критерий независимых выборок t

Критерий t для независимых выборок используется для сравнения средних значений двух отдельных выборок ( M 1 и M 2 ). Две выборки могли быть протестированы в разных условиях в эксперименте между субъектами или они могли быть ранее существовавшими группами в корреляционном плане (например, женщины и мужчины, экстраверты и интроверты). Нулевая гипотеза состоит в том, что средние значения двух совокупностей одинаковы: µ 1 = µ 2 . Альтернативная гипотеза состоит в том, что они не совпадают: µ 1 ≠ µ 2 . Опять же, тест может быть односторонним, если у исследователя есть веские основания ожидать, что разница пойдет в определенном направлении.


Статистика t здесь немного сложнее, потому что она должна учитывать два средних значения выборки, два стандартных отклонения и два размера выборки. Формула выглядит следующим образом:



Обратите внимание, что эта формула включает квадраты стандартных отклонений (дисперсии), которые появляются внутри символа квадратного корня. Кроме того, строчные буквы n 1 и n 2 относятся к размерам выборки в двух группах или условиях (в отличие от заглавной буквы N , которая обычно относится к общему размеру выборки). Единственная дополнительная вещь, которую нужно знать здесь, это то, что для t - критерия независимых выборок существует N - 2 степени свободы .


Пример t -критерия независимых выборок

Теперь психолог здоровья хочет сравнить оценки калорийности людей, которые регулярно едят нездоровую пищу, с оценками людей, которые редко едят нездоровую пищу. Он считает, что разница может проявляться в любом направлении, поэтому решает провести двусторонний тест. Он собирает данные по выборке из восьми участников, которые регулярно едят нездоровую пищу, и семи участников, которые редко едят нездоровую пищу. Данные следующие:


  


Любители нездоровой пищи: 180, 220, 150, 85, 200, 170, 150, 190


Любители нездоровой пищи: 200, 240, 190, 175, 200, 300, 240


  


Среднее значение для любителей нездоровой пищи составляет 220,71 при стандартном отклонении 41,23. Среднее значение для тех, кто ест нездоровую пищу, составляет 168,12 со стандартным отклонением 42,66. Теперь он может вычислить свой t -показатель следующим образом:



Если он введет данные в один из онлайн-инструментов анализа или воспользуется Excel или SPSS, он сообщит ему, что двустороннее значение p для этого показателя t (с 15 − 2 = 13 степенями свободы) равно 0,015. Поскольку этот показатель меньше 0,05, психолог в области здравоохранения отклонит нулевую гипотезу и сделает вывод, что люди, которые регулярно едят нездоровую пищу, оценивают калорийность ниже, чем люди, которые едят ее редко. Если бы ему нужно было вычислить показатель t вручную, он мог бы взглянуть на Таблицу 13.2 «Таблица критических значений» и увидеть, что критическое значение t для двустороннего критерия с 13 степенями свободы составляет ±2,160. Тот факт, что его показатель t был более экстремальным, чем это критическое значение, говорил бы ему, что егозначение p меньше 0,05 и что он не сможет принять нулевую гипотезу.


Дисперсионный анализ

Когда необходимо сравнить более двух групп или средних условий, наиболее распространенным тестом нулевой гипотезы является дисперсионный анализ (ANOVA) . В этом разделе мы рассмотрим в первую очередь однофакторный дисперсионный анализ , который используется для планов между субъектами с одной независимой переменной. Затем мы кратко рассмотрим некоторые другие версии дисперсионного анализа, которые используются для внутрисубъектных и факторных планов исследования.


Односторонний дисперсионный анализ

Однофакторный дисперсионный анализ используется для сравнения средних значений более чем двух выборок ( M1 , M 2 … MG ) в плане между субъектами. Нулевая гипотеза состоит в том, что все средние в популяции равны: µ 1 = µ 2 =…= µ G . Альтернативная гипотеза состоит в том, что не все средства в популяции равны.


Тестовая статистика для ANOVA называется F . Это отношение двух оценок дисперсии генеральной совокупности на основе выборочных данных. Одна оценка дисперсии генеральной совокупности называется средним квадратом между группами ( MS B ) и основана на различиях между выборочными средними значениями. Другой называется средними квадратами внутри групп ( MSW) и основан на различиях между оценками в каждой группе. Статистика F представляет собой отношение MS B к MS W и, следовательно, может быть выражена следующим образом:


Опять же, причина полезности F заключается в том, что мы знаем, как она распределяется, когда нулевая гипотеза верна. Как показано на рис. 13.2 «Распределение » , это распределение унимодальное и имеет положительную асимметрию со значениями, которые группируются вокруг 1. Точная форма распределения зависит как от количества групп, так и от размера выборки, и существует несколько степеней свободы. значение, связанное с каждым из них. Межгрупповые степени свободы — это количество групп минус одна: df B = ( G − 1). Степени свободы внутри групп равны общему объему выборки минус количество групп: df W = N − G . Опять же, зная распределениеF , когда нулевая гипотеза верна, позволяет нам найти значение p .


Рисунок 13.2 . Распределение отношения F с 2 и 37 степенями свободы, когда нулевая гипотеза верна.



Красная вертикальная линия представляет собой критическое значение, когда α равно 0,05.


Онлайн-инструменты в главе 12 «Описательная статистика» и статистическое программное обеспечение, такое как Excel и SPSS, вычислят F и найдут значение p . Если p меньше 0,05, то мы отклоняем нулевую гипотезу и делаем вывод, что существуют различия между средними значениями групп в популяции. Если p больше 0,05, то мы сохраняем нулевую гипотезу и делаем вывод, что недостаточно доказательств, чтобы сказать, что существуют различия. В том маловероятном случае, если мы будем вычислять F вручную, мы можем использовать для принятия решения таблицу критических значений, подобную Таблице 13.3 «Таблица критических значений» . Идея состоит в том, что любой Fсоотношение выше критического значения имеет значение р менее 0,05. Таким образом, если вычисленное нами отношение F превышает критическое значение, мы отвергаем нулевую гипотезу. Если вычисленное нами отношение F меньше критического значения, то мы сохраняем нулевую гипотезу.


Таблица 13.3 Таблица критических значений F при α = 0,05


дф Б

дф Вт 2 3 4

8 4.459 4.066 3.838

9 4.256 3.863 3,633

10 4.103 3.708 3.478

11 3,982 3,587 3,357

12 3,885 3.490 3.259

13 3.806 3.411 3.179

14 3,739 3.344 3.112

15 3,682 3.287 3.056

16 3,634 3.239 3.007

17 3,592 3.197 2,965

18 3,555 3.160 2,928

19 3.522 3.127 2.895

20 3.493 3.098 2,866

21 3.467 3.072 2.840

22 3.443 3.049 2.817

23 3.422 3.028 2.796

24 3.403 3.009 2,776

25 3,385 2,991 2,759

30 3.316 2,922 2.690

35 3,267 2.874 2,641

40 3.232 2.839 2.606

45 3.204 2.812 2,579

50 3.183 2.790 2,557

55 3,165 2,773 2.540

60 3.150 2,758 2,525

65 3.138 2,746 2,513

70 3.128 2,736 2.503

75 3.119 2,727 2.494

80 3.111 2,719 2,486

85 3.104 2,712 2.479

90 3.098 2.706 2,473

95 3.092 2.700 2,467

100 3.087 2.696 2,463

Пример однофакторного дисперсионного анализа

Представьте, что медицинский психолог хочет сравнить оценки калорийности специалистов по психологии, питанию и профессиональных диетологов. Он собирает следующие данные:


Психологические специальности: 200, 180, 220, 160, 150, 200, 190, 200

Специальности по питанию: 190, 220, 200, 230, 160, 150, 200, 210, 195

Диетологи: 220, 250, 240, 275, 250, 230, 200, 240

Средние значения составляют 187,50 ( SD = 23,14), 195,00 ( SD = 27,77) и 238,13 ( SD = 22,35) соответственно. Таким образом, получается, что диетологи в среднем сделали значительно более точные оценки. Исследователь почти наверняка введет эти данные в программу, такую ​​как Excel или SPSS, которая вычислит для него F и найдет значение p . В Таблице 13.4 «Типичный однофакторный результат дисперсионного анализа из Excel» показаны выходные данные функции однофакторного дисперсионного анализа в Excel для этих данных. Это называется таблицей ANOVA. Он показывает, что MS B составляет 5971,88, MS W составляет 602,23, а их отношение F равно 9,92. р _значение 0,0009. Поскольку это значение ниже 0,05, исследователь отклонил бы нулевую гипотезу и пришел к выводу, что средние оценки калорий для трех групп не совпадают в популяции. Обратите внимание, что таблица ANOVA также включает «сумму квадратов» ( SS ) между группами и внутри групп. Эти значения вычисляются на пути к нахождению MS B и MS W , но исследователь обычно не сообщает их. Наконец, если бы исследователь вычислил отношение F вручную, он мог бы посмотреть в Таблицу 13.3 «Таблица критических значений» и увидеть, что критическое значение F с 2 и 21 степенями свободы равно 3,467 (то же самое значение вТабл. 13.4 «Типичный однофакторный результат дисперсионного анализа из Excel» в разделе F крит ). Тот факт, что его показатель t был более экстремальным, чем это критическое значение, сказал бы ему, что его значение p меньше 0,05 и что он должен отклонить нулевую гипотезу.


Табл. 13.4. Типичные выходные данные однофакторного дисперсионного анализа из Excel


дисперсионный анализ

Источник вариаций SS дф РС Ф р-значение F крит

Между группами 11 943,75 2 5 971 875 9.916234 0,000928 3,4668

Внутри групп 12 646,88 21 602.2321

Общий 24 590,63 23

ANOVA Разработки

Постфактум сравнения

Когда мы отвергаем нулевую гипотезу в однофакторном дисперсионном анализе, мы приходим к выводу, что групповые средние не все одинаковы в популяции. Но это может свидетельствовать о разных вещах. С тремя группами это может указывать на то, что все три средства значительно отличаются друг от друга. Или это может указывать на то, что одно из средств значительно отличается от двух других, но два других существенно не отличаются друг от друга. Например, может случиться так, что средние оценки калорийности специалистов по психологии, питанию и диетологов значительно отличаются друг от друга. Или может случиться так, что средние значения для диетологов значительно отличаются от средних значений для специалистов по психологии и питанию, но средние значения для специалистов по психологии и питанию существенно не отличаются друг от друга. По этой причине,апостериорные сравнения выбранных пар групповых средств для определения того, какие из них отличаются от других.


Одним из подходов к апостериорным сравнениям может быть проведение серии t - критериев для независимых выборок, сравнивающих среднее значение каждой группы со средним значением каждой другой группы. Но есть проблема с этим подходом. В общем, если мы проводим t -тест, когда нулевая гипотеза верна, у нас есть 5%-й шанс ошибочно отвергнуть нулевую гипотезу (см. Раздел 13.3 «Дополнительные соображения» для получения дополнительной информации об ошибках типа I). Если мы проводим несколько t -тестов, когда нулевая гипотеза верна, вероятность ошибочного отклонения хотя бы одной нулевой гипотезы увеличивается с каждым проводимым нами тестом. Таким образом, исследователи обычно не проводят апостериорных сравнений, используя стандартные t.тесты, потому что слишком велика вероятность того, что они ошибочно отклонят хотя бы одну нулевую гипотезу. Вместо этого они используют одну из нескольких модифицированных процедур t -критерия, среди которых процедура Бонферонни, критерий Фишера наименьшей значимой разницы (LSD) и критерий честно значимой разницы Тьюки (HSD). Детали этих подходов выходят за рамки этой книги, но важно понять их назначение. Это необходимо для того, чтобы свести риск ошибочного отклонения истинной нулевой гипотезы к приемлемому уровню (близкому к 5%).


Дисперсионный анализ с повторными измерениями

Напомним, что однофакторный дисперсионный анализ подходит для межсубъектных планов, в которых сравниваемые средние значения исходят от отдельных групп участников. Это не подходит для внутрисубъектных планов, в которых сравниваемые средние значения получены от одних и тех же участников, протестированных в разных условиях или в разное время. Для этого требуется несколько иной подход, называемый дисперсионным анализом с повторными измерениями . Основы дисперсионного анализа с повторными измерениями такие же, как и для однофакторного дисперсионного анализа. Основное отличие состоит в том, что многократное измерение зависимой переменной для каждого участника позволяет более точно измерить MS W.. Представьте, например, что зависимая переменная в исследовании — это мера времени реакции. Некоторые участники будут быстрее или медленнее других из-за устойчивых индивидуальных различий в их нервной системе, мышцах и других факторах. В плане между субъектами эти стабильные индивидуальные различия просто увеличат изменчивость внутри групп и увеличат значение MS W . Однако при внутрисубъектном плане эти стабильные индивидуальные различия можно измерить и вычесть из значения MS W . Это более низкое значение MS W означает более высокое значение F и более чувствительный тест.


Факторный анализ

Когда в факторный план включено более одной независимой переменной, подходящим подходом является факторный дисперсионный анализ . Опять же, основы факторного дисперсионного анализа такие же, как и для однофакторного дисперсионного анализа и дисперсионного анализа с повторными измерениями. Основное отличие состоит в том, что для каждого основного эффекта и для каждого взаимодействия выводятся коэффициент F и значение p . Возвращаясь к нашему примеру с оценкой калорий, представьте, что психолог по вопросам здоровья проверяет влияние основного участника (психология или питание) и типа пищи (печенье или гамбургер) в факторном плане. Факторный ANOVA даст отдельные отношения F и pзначения для основного эффекта мажора, основного эффекта типа пищи и взаимодействия между мажором и едой. Соответствующие модификации должны быть сделаны в зависимости от того, является ли дизайн между субъектами, внутри субъектов или смешанными.


Тестирование Пирсона r

Для взаимосвязей между количественными переменными, где r Пирсона используется для описания силы этих взаимосвязей, подходящей проверкой нулевой гипотезы является проверка r Пирсона . Основная логика точно такая же, как и для других тестов нулевой гипотезы. В этом случае нулевая гипотеза состоит в том, что в популяции нет связи. Мы можем использовать греческую строчную букву rho (ρ) для представления соответствующего параметра: ρ = 0. Альтернативная гипотеза состоит в том, что в популяции существует взаимосвязь: ρ ≠ 0. Как и в случае t - теста, этот тест может быть двусторонним . если у исследователя нет ожиданий в отношении направления связи или односторонние, если исследователь ожидает, что отношения будут развиваться в определенном направлении.


Можно использовать r Пирсона для выборки, чтобы вычислить t - показатель с N - 2 степенями свободы, а затем продолжить, как для t - критерия. Однако из-за того, как он вычисляется, r Пирсона также можно рассматривать как собственную тестовую статистику. Статистические онлайн-инструменты и статистическое программное обеспечение, такое как Excel и SPSS, обычно вычисляют r Пирсона и предоставляют значение p , связанное с этим значением r Пирсона . Как всегда, если значение р меньше 0,05, мы отклоняем нулевую гипотезу и делаем вывод, что существует связь между переменными в популяции. Если рзначение больше 0,05, мы сохраняем нулевую гипотезу и делаем вывод, что недостаточно доказательств, чтобы сказать, что существует связь в популяции. Если мы вычислим r Пирсона вручную, мы можем использовать таблицу, подобную Таблице 13.5 «Таблица критических значений Пирсона» , которая показывает критические значения r для различных размеров выборок, когда α равно 0,05. Выборочное значение r Пирсона, превышающее критическое значение, является статистически значимым.


Таблица 13.5 Таблица критических значений r Пирсона при α = 0,05


Критическое значение r

Н Однохвостый Двухвостый

5 0,805 0,878

10 0,549 0,632

15 .441 0,514

20 0,378 0,444

25 0,337 0,396

30 .306 0,361

35 0,283 0,334

40 0,264 .312

45 0,248 0,294

50 0,235 0,279

55 0,224 0,266

60 0,214 0,254

65 .206 0,244

70 .198 0,235

75 .191 0,227

80 0,185 .220

85 .180 0,213

90 0,174 .207

95 .170 .202

100 0,165 .197

Пример теста Пирсона r

Представьте, что психолога здоровья интересует корреляция между оценками калорийности людей и их весом. У него нет ожиданий относительно направления отношений, поэтому он решает провести двусторонний тест. Он вычисляет корреляцию для выборки из 22 студентов колледжа и находит, что r Пирсона составляет -0,21. Статистическое программное обеспечение, которое он использует, сообщает ему, что значение р равно 0,348. Это больше, чем 0,05, поэтому он сохраняет нулевую гипотезу и заключает, что нет никакой связи между оценками калорий людей и их весом. Если бы ему нужно было вычислить r Пирсона вручную, он мог бы взглянуть на таблицу 13.5 «Таблица критических значений Пирсона».и видим, что критическое значение для 22 - 2 = 20 степеней свободы составляет 0,444. Тот факт, что r Пирсона для выборки менее экстремально, чем это критическое значение, говорит ему, что значение p больше 0,05 и что он должен сохранить нулевую гипотезу.


КЛЮЧЕВЫЕ ВЫВОДЫ

Чтобы сравнить два средних значения, наиболее распространенным тестом нулевой гипотезы является t - тест. Одновыборочный t - критерий используется для сравнения среднего значения одной выборки с интересующим гипотетическим средним значением генеральной совокупности, t - критерий зависимых выборок используется для сравнения двух средних в планах внутри субъектов, а t - критерий независимых выборок используется для сравнить два средства в дизайне между субъектами.

Для сравнения более чем двух средних наиболее распространенным тестом нулевой гипотезы является дисперсионный анализ (ANOVA). Однофакторный дисперсионный анализ используется для планов между субъектами с одной независимой переменной, дисперсионный анализ с повторными измерениями используется для внутрисубъектных планов, а факторный дисперсионный анализ используется для факторных планов.

Проверка нулевой гипотезы r Пирсона используется для сравнения выборочного значения r Пирсона с гипотетическим значением генеральной совокупности, равным 0.

УПРАЖНЕНИЯ

Практика: используйте один из онлайн-инструментов, Excel или SPSS, чтобы воспроизвести t-критерий для одной выборки , t - критерий для зависимых выборок , t - критерий для независимых выборок и однофакторный дисперсионный анализ для четырех наборов данных оценки калорий, представленных в этом документе. раздел.

Практика: Выборка из 25 студентов колледжа оценила свое дружелюбие по шкале от 1 ( намного ниже среднего ) до 7 ( намного выше среднего ). Их средний рейтинг составил 5,30 при стандартном отклонении 1,50. Проведите одновыборочный t - критерий, сравнивая их средний рейтинг с гипотетическим средним рейтингом 4 ( среднее ). Вопрос в том, склонны ли студенты колледжей оценивать себя как более дружелюбных, чем в среднем.

Практика: Решите, является ли каждое из следующих значений r Пирсона статистически значимым как для одностороннего, так и для двустороннего критерия. (а) Корреляция между ростом и IQ составляет +,13 в выборке из 35 человек. (б) Для выборки из 88 студентов колледжа корреляция между тем, насколько они отвращение испытывают, и резкостью их моральных суждений составляет +,23. (c) Корреляция между количеством ежедневных хлопот и хорошим настроением составляет -0,43 для выборки из 30 взрослых среднего возраста.

13.3 Дополнительные соображения

ЦЕЛИ ОБУЧЕНИЯ

Дайте определение ошибкам Типа I и Типа II, объясните, почему они происходят, и определите некоторые шаги, которые можно предпринять, чтобы свести к минимуму их вероятность.

Дайте определение статистической мощности, объясните ее роль в планировании новых исследований и используйте онлайн-инструменты для расчета статистической мощности простых планов исследований.

Перечислите некоторые критические замечания по поводу традиционной проверки нулевых гипотез, а также некоторые способы борьбы с этими критическими замечаниями.

В этом разделе мы рассмотрим несколько других вопросов, связанных с проверкой нулевой гипотезы, включая те, которые полезны при планировании исследований и интерпретации результатов. Мы даже рассматриваем некоторые давние критические замечания в отношении проверки нулевых гипотез, а также некоторые шаги, предпринятые исследователями в области психологии для их устранения.


Ошибки при проверке нулевой гипотезы

При проверке нулевой гипотезы исследователь пытается сделать разумный вывод о совокупности на основе выборки. К сожалению, правильность этого вывода не гарантируется. Это показано на рис. 13.3 «Два типа правильных решений и два типа ошибок при проверке нулевой гипотезы».. Строки этой таблицы представляют два возможных решения, которые мы можем принять при проверке нулевой гипотезы: отклонить или сохранить нулевую гипотезу. Столбцы представляют два возможных состояния мира: нулевая гипотеза ложна или верна. Таким образом, четыре ячейки таблицы представляют четыре различных результата проверки нулевой гипотезы. Два исхода — отклонение нулевой гипотезы, когда она ложна, и сохранение ее, когда она верна, — являются правильными решениями. Два других — отклонение нулевой гипотезы, когда она верна, и сохранение ее, когда она ложна, — являются ошибками.


Рис. 13.3 . Два типа правильных решений и два типа ошибок при проверке нулевой гипотезы



Отказ от нулевой гипотезы, когда она верна, называется ошибкой первого рода . Это означает, что мы пришли к выводу, что в популяции есть связь, хотя на самом деле ее нет. Ошибки типа I возникают потому, что даже при отсутствии взаимосвязи в генеральной совокупности ошибка выборки сама по себе иногда приводит к экстремальным результатам. На самом деле, когда нулевая гипотеза верна и α равно 0,05, мы ошибочно отвергаем нулевую гипотезу в 5% случаев. (Вот почему α иногда называют «коэффициентом ошибок типа I».) Сохранение нулевой гипотезы, когда она ложна, называется ошибкой типа II .. Это означает, что мы пришли к выводу, что родства в популяции нет, хотя на самом деле оно есть. На практике ошибки типа II возникают главным образом из-за того, что плану исследования не хватает достаточной статистической мощности для выявления взаимосвязи (например, выборка слишком мала). Вскоре мы еще поговорим о статистической мощности.


В принципе, можно уменьшить вероятность ошибки типа I, установив значение α меньше 0,05. Установка его на 0,01, например, будет означать, что если нулевая гипотеза верна, то вероятность ее ошибочного отклонения составляет всего 1%. Но усложнение процесса отклонения истинных нулевых гипотез также затрудняет отклонение ложных и, следовательно, увеличивает вероятность ошибки типа II. Точно так же можно уменьшить вероятность ошибки типа II, установив α чем-то большим, чем 0,05 (например, 0,10). Но облегчение отклонения ложных нулевых гипотез также облегчает отклонение истинных и, следовательно, увеличивает вероятность ошибки типа I. Это дает некоторое представление о том, почему принято устанавливать α равным 0,05.


Возможность совершения ошибок типа I и типа II имеет несколько важных последствий для интерпретации результатов наших собственных и чужих исследований. Во-первых, нам следует с осторожностью интерпретировать результаты любого отдельного исследования, потому что есть шанс, что оно отражает ошибку типа I или типа II. Вот почему исследователи считают важным повторить свои исследования. Каждый раз, когда исследователи повторяют исследование и находят похожий результат, они по праву становятся более уверенными в том, что результат представляет собой реальное явление, а не просто ошибку типа I или типа II.


Еще одна проблема, связанная с ошибками типа I, — это так называемая проблема ящика для файлов (Rosenthal, 1979). Розенталь, Р. (1979). Проблема с ящиком для файлов и терпимость к нулевым результатам. Психологический бюллетень , 83 , 638–641.Идея состоит в том, что, когда исследователи получают статистически значимые результаты, они, как правило, представляют их для публикации, а редакторы журналов и рецензенты склонны их принимать. Но когда исследователи получают незначительные результаты, они, как правило, не представляют их для публикации, а если и представляют, то редакторы журналов и рецензенты, как правило, их не принимают. Исследователи заканчивают тем, что прячут эти несущественные результаты в ящик для документов (или в настоящее время в папку на своем жестком диске). Одним из следствий этого является то, что опубликованная литература, вероятно, содержит более высокую долю ошибок типа I, чем мы могли бы ожидать, основываясь только на статистических соображениях. Даже когда между двумя переменными в популяции существует взаимосвязь, опубликованная исследовательская литература, вероятно, преувеличивает силу этой взаимосвязи. Представьте, например, что связь между двумя переменными в совокупности положительна, но слаба (например, ρ = +,10). Если несколько исследователей проводят исследования этой взаимосвязи, ошибка выборки, вероятно, приведет к результатам, варьирующимся от слабых отрицательных взаимосвязей (например,r = −0,10) до умеренно сильных положительных (например, r = +0,40). Но из-за проблемы ящика с файлами, скорее всего, будут опубликованы только те исследования, которые показывают положительные отношения от умеренных до сильных. В результате эффект, о котором сообщается в опубликованной литературе, имеет тенденцию быть сильнее, чем на самом деле в популяции.


Проблема ящика с папками трудна, потому что она является продуктом того, как научные исследования традиционно проводились и публиковались. Одно из решений может состоять в том, чтобы редакторы журналов и рецензенты оценивали исследования, представленные для публикации, не зная результатов этого исследования. Идея состоит в том, что если вопрос исследования признан интересным, а метод признан надежным, то незначительный результат должен быть столь же важным и достойным публикации, как и значительный. За исключением столь радикального изменения в том, как исследование оценивается для публикации, исследователи все еще могут приложить усилия, чтобы сохранить свои незначительные результаты и поделиться ими как можно шире (например, на профессиональных конференциях). Многие научные дисциплины теперь имеют журналы, посвященные публикации несущественных результатов. В психологии, например,Журнал статей в поддержку нулевой гипотезы ( http://www.jasnh.com ).


Статистическая мощность

Статистическая мощность плана исследования — это вероятность отклонения нулевой гипотезы с учетом размера выборки и ожидаемой силы взаимосвязи. Например, статистическая мощность исследования с 50 участниками и ожидаемым коэффициентом Пирсона rиз +0,30 в населении составляет 0,59. То есть вероятность отклонения нулевой гипотезы составляет 59%, если корреляция населения действительно составляет +0,30. Статистическая мощность является дополнением к вероятности совершения ошибки второго рода. Таким образом, в этом примере вероятность совершения ошибки типа II будет равна 1 - 0,59 = 0,41. Ясно, что исследователи должны быть заинтересованы в эффективности своих исследовательских планов, если они хотят избежать ошибок типа II. В частности, они должны убедиться, что их дизайн исследования имеет достаточную мощность, прежде чем собирать данные. Общепринятым правилом является то, что степень 0,80 является адекватной. Это означает, что вероятность отклонения нулевой гипотезы для ожидаемой силы связи составляет 80%.


Тема расчета мощности для различных исследовательских планов и проверки нулевых гипотез выходит за рамки этой книги. Однако существуют онлайн-инструменты, которые позволяют вам сделать это, введя размер выборки, ожидаемую силу связи и уровень α для различных проверок гипотез (см. «Вычислительная мощность в Интернете»). Кроме того, в таблице 13.6 «Размеры выборки, необходимые для достижения статистической мощности 0,80 для различных ожидаемых сил связи для независимых выборок» показан размер выборки, необходимый для достижения мощности 0,80 для слабых, средних и сильных связей для двух независимых выборок. -критерий t для независимых выборок и двусторонний критерий Пирсона r. Обратите внимание, что в этой таблице усиливается мнение, сделанное ранее о силе взаимосвязи, размере выборки и статистической значимости. В частности, слабые отношения требуют очень больших выборок для обеспечения адекватной статистической мощности.


Таблица 13.6 Размер выборки, необходимый для достижения статистической мощности 0,80 для различных ожидаемых сил связи для теста t независимых выборок и теста Пирсона r


Проверка нулевой гипотезы

Сила отношений t - критерий независимых выборок Тест Пирсона r

Сильный ( d = 0,80, r = 0,50) 52 28

Средний ( d = 0,50, r = 0,30) 128 84

Слабый ( d = 0,20, r = 0,10) 788 782

Что делать, если вы обнаружите, что ваш план исследования не обладает достаточной мощностью? Представьте, например, что вы проводите эксперимент между субъектами с 20 участниками в каждом из двух условий и ожидаете среднюю разницу ( d = 0,50) в популяции. Статистическая мощность этого плана составляет всего 0,34. То есть, даже если имеется среднее различие в популяции, вероятность отклонения нулевой гипотезы составляет примерно один к трем, а вероятность совершения ошибки типа II составляет примерно два из трех. Учитывая время и усилия, затраченные на проведение исследования, это, вероятно, кажется неприемлемо низким шансом отвергнуть нулевую гипотезу и неприемлемо высоким шансом совершения ошибки типа II.


Учитывая, что статистическая мощность зависит в первую очередь от силы связи и размера выборки, есть два основных шага, которые вы можете предпринять, чтобы увеличить статистическую мощность: увеличить силу связи или увеличить размер выборки. Повышение силы взаимосвязи иногда может быть достигнуто за счет более жесткой манипуляции или более тщательного контроля посторонних переменных для уменьшения количества шума в данных (например, путем использования плана внутри субъектов, а не плана между субъектами). Однако обычной стратегией является увеличение размера выборки. Для любой ожидаемой силы связи всегда будет некоторая выборка, достаточно большая для достижения адекватной мощности.


Вычислительная мощность онлайн

Следующие ссылки относятся к инструментам, позволяющим вычислять статистическую мощность для различных планов исследований и проверок нулевых гипотез путем ввода информации об ожидаемой силе взаимосвязи, размере выборки и уровне α. Они также позволяют вычислить размер выборки, необходимый для достижения желаемого уровня мощности (например, 0,80). Во-первых, это онлайн-инструмент. Вторая — бесплатная загружаемая программа под названием G*Power.


Страница силы и размера выборки Расса Лента: http://www.stat.uiowa.edu/~rlenth/Power/index.html

G*Power: http://www.psycho.uni-duesseldorf.de/aap/projects/gpower

Проблемы с проверкой нулевой гипотезы и некоторые решения

Опять же, проверка нулевой гипотезы является наиболее распространенным подходом к статистике вывода в психологии. Однако не обошлось без критиков. Фактически, в последние годы критика стала настолько заметной, что Американская психологическая ассоциация созвала целевую группу, чтобы дать рекомендации о том, как с ней бороться (Wilkinson & Task Force on Statistical Inference, 1999). Уилкинсон Л. и Целевая группа по статистическим выводам. (1999). Статистические методы в журналах по психологии: рекомендации и пояснения. Американский психолог , 54 , 594–604. В этом разделе мы рассмотрим некоторые критические замечания и некоторые рекомендации.


Критика проверки нулевой гипотезы

Некоторая критика проверки нулевой гипотезы сосредоточена на неправильном понимании ее исследователями. Мы уже видели, например, что значение p часто неправильно интерпретируется как вероятность того, что нулевая гипотеза верна. (Напомним, что на самом деле это вероятность результата выборки , если нулевая гипотеза верна.) Тесно связанное неправильное толкование состоит в том, что 1 - p - это вероятность воспроизведения статистически значимого результата. В одном исследовании 60 % выборки профессиональных исследователей считали, что значение p , равное 0,01, — для независимого t - критерия с 20 участниками в каждой — означает 99-процентную вероятность воспроизвести статистически значимый результат (Оукс). , 1986).Оукс, М. (1986). Статистический вывод: комментарий для социальных и поведенческих наук . Чичестер, Великобритания: Wiley. Наше предыдущее обсуждение власти должно прояснить, что это слишком оптимистично. Как показывает таблица 13.5 «Таблица критических значений Пирсона» , даже если бы существовала большая разница между средними значениями в популяции, для достижения степени 0,80 потребовалось бы 26 участников на выборку. А программа G*Power показывает, что для достижения степени 0,99 потребуется 59 участников на выборку.


Другой набор критических замечаний касается логики проверки нулевой гипотезы. Для многих строгое правило отвергать нулевую гипотезу, когда p меньше 0,05, и сохранять ее, когда p больше 0,05, не имеет большого смысла. Эта критика связана не с конкретным значением 0,05, а с идеей о том, что должна быть какая-то жесткая разделительная линия между результатами, которые считаются значимыми, и результатами, которые не являются таковыми. Представьте себе два исследования одной и той же статистической взаимосвязи с одинаковыми размерами выборки. Один имеет значение p 0,04, а другой - pзначение 0,06. Хотя оба исследования дали по существу один и тот же результат, первое, вероятно, будет сочтено интересным и достойным публикации, а второе просто не имеет большого значения. Это соглашение, вероятно, помешает публикации хороших исследований и усугубит проблему ящика для документов.


Еще одна группа критических замечаний сосредоточена на идее о том, что проверка нулевой гипотезы — даже при правильном понимании и проведении — просто не очень информативна. Напомним, что нулевая гипотеза состоит в том, что между переменными в генеральной совокупности нет связи (например, d Коэна или r Пирсона точно равны 0). Таким образом, отвергнуть нулевую гипотезу — значит просто сказать, что в популяции существует некоторая ненулевая взаимосвязь. Но на самом деле это не очень много говорит. Представьте, если бы химия могла сказать нам только то, чтовзаимосвязь между температурой газа и его объемом, а не предоставление точного уравнения для описания этой взаимосвязи. Некоторые критики даже утверждают, что отношение между двумя переменными в генеральной совокупности никогда не бывает точно равным 0, если оно проводится с достаточным количеством знаков после запятой. Другими словами, нулевая гипотеза никогда не бывает истинна буквально. Таким образом, отказ от него не говорит нам ничего, чего мы еще не знали!


Справедливости ради следует отметить, что многие исследователи встали на защиту проверки нулевой гипотезы. Один из них, Роберт Абельсон, утверждал, что при правильном понимании и проведении проверка нулевой гипотезы действительно служит важной цели (Abelson, 1995). Абельсон, Р.П. (1995). Статистика как принципиальный аргумент . Махва, Нью-Джерси: Эрлбаум. Особенно когда речь идет о новых явлениях, это дает исследователям принципиальный способ убедить других в том, что их результаты не следует отбрасывать как простое случайное происшествие.


Что делать?

Даже те, кто защищает проверку нулевой гипотезы, признают многие связанные с этим проблемы. Но что делать? Некоторые предложения теперь появляются в Руководстве по публикации . Во-первых, каждый тест нулевой гипотезы должен сопровождаться показателем размера эффекта, таким как d Коэна или r Пирсона . Поступая таким образом, исследователь дает оценку того, насколько сильны отношения в популяции, а не только есть ли они или нет. (Помните, что значение p не может служить мерой силы связи, поскольку оно также зависит от размера выборки. Даже очень слабый результат может быть статистически значимым, если выборка достаточно велика.)


Другое предложение состоит в том, чтобы использовать доверительные интервалы, а не тесты на нулевую гипотезу. Доверительный интервалвокруг статистики - это диапазон значений, который рассчитывается таким образом, что некоторый процент времени (обычно 95%) параметр совокупности будет находиться в этом диапазоне. Например, выборка из 20 студентов колледжа может иметь оценку средней калорийности шоколадного печенья, равную 200, с 95% доверительным интервалом от 160 до 240. Население студентов колледжей составляет от 160 до 240 человек. Сторонники доверительных интервалов утверждают, что их гораздо легче интерпретировать, чем тесты нулевой гипотезы. Еще одно преимущество доверительных интервалов заключается в том, что они предоставляют информацию, необходимую для проверки нулевой гипотезы, если кто-то захочет. В этом примере выборочное среднее значение 200 значительно отличается на уровне . 05 из любой гипотетической популяции означает, что лежит за пределами доверительного интервала. Таким образом, доверительный интервал от 160 до 240 говорит нам о том, что среднее значение выборки статистически значимо отличается от гипотетического среднего значения популяции, равного 250.


Наконец, существуют более радикальные решения проблем проверки нулевой гипотезы, которые включают использование совершенно разных подходов к статистике логического вывода. Байесовская статистика , например, представляет собой подход, при котором исследователь указывает вероятность того, что нулевая гипотеза и любые важные альтернативные гипотезы верны, прежде чем проводить исследование, проводит исследование, а затем обновляет вероятности на основе данных. Пока рано говорить о том, станет ли этот подход общепринятым в психологических исследованиях. На данный момент проверка нулевой гипотезы, подкрепленная мерами размера эффекта и доверительными интервалами, остается доминирующим подходом.


КЛЮЧЕВЫЕ ВЫВОДЫ

Решение отклонить или сохранить нулевую гипотезу не обязательно будет правильным. Ошибка типа I возникает, когда нулевая гипотеза отвергается, когда она верна. Ошибка типа II возникает, когда не удается отвергнуть нулевую гипотезу, когда она ложна.

Статистическая мощность плана исследования — это вероятность отклонения нулевой гипотезы с учетом ожидаемой силы взаимосвязи в популяции и размера выборки. Исследователи должны убедиться, что их исследования имеют достаточную статистическую мощность, прежде чем проводить их.

Проверка нулевой гипотезы подвергалась критике на том основании, что исследователи неправильно ее понимают, что она нелогична и неинформативна. Другие утверждают, что он служит важной цели, особенно при использовании с мерами размера эффекта, доверительными интервалами и другими методами. Он остается доминирующим подходом к логической статистике в психологии.

УПРАЖНЕНИЯ

Обсуждение: Исследователь сравнивает эффективность двух форм психотерапии социальной фобии, используя t - тест независимых выборок.


Объясните, что для исследователя будет означать совершение ошибки первого рода.

Объясните, что для исследователя будет означать совершение ошибки типа II.

Обсуждение: представьте, что вы проводите t -тест, и значение p равно 0,02. Как бы вы объяснили, что означает это значение p , тому, кто еще не знаком с проверкой нулевой гипотезы? Обязательно избегайте распространенных неверных интерпретаций значения p .


  81122



Комментарии

Популярные сообщения из этого блога

  Мы боимся секса с новой женщиной  Да, это правда: мы, мужчины, действительно все время думаем о сексе, и если бы мы столкнулись с пышным декольте, при этом у дамы было бы три глаза и чихуахуа на голове, мы бы этого не заметили. Но когда дело доходит до первого интимного контакта с новой дамой… Наш пульс танцует польку, и мы делаем очень странные вещи. Мы изо всех сил напрягаем мышцы тазового дна, выпиваем литры ананасового сока (который должен улучшить вкус спермы) и гуглим технику куннилингуса. Но когда женщина лежит перед нами совершенно голая, мы так же робки, как и в первый раз.
    сайты для фриланса   studwork     Заработок на написании научных работ.  Зарабатывайте на сайте фриланса ежедневно. биржа ссылок     http://www.rotapost.ru/   биржа фриланса  https://kwork.ru    Биржа консалтинга  https://www.liveexpert.ru Купить хостинг домен     ukraine.com.ua биржа ссылок рекламы     blogun   платежная система для фрилансеров  capitalist  Купить книгу " форекс основы " электронная версия, цена 2 доллара Купить книгу " фото городов США " электронная версия, цена 2 доллара Купить книгу " 1000 бизнес- идей " электронная версия, цена 2 доллара Купить книгу "Золотые правила общения" электронная версия, цена 2 доллара Купить емейл базу 500 000 адресов, пишите на почту написать по вопросу покупки   toshatereh@gmail.com   ИЛИ  aarci4772@gmail.com  Напишите на почту - e - mail,   Вам дадут реквизиты для о...