|
|
|
Содержание
Коэффициент Корреляции
- Коэффициент Корреляции Пирсона
- Коэффициент ранговой Корреляции Кенделла
- Коэффициент ранговой Корреляции Спирмена
- Коэффициент Корреляции знаков Фехнера
- Коэффициент множественной ранговой Корреляции (Конкордации)
- Биссериальный коэффициент
- Свойства коэффициента Корреляции
Корреляционный анализ
- Ограничения корреляционного анализа
- Область применения
Ложная корреляция
Частная корреляция
Корреляция между валютами
Электронная корреляция
Парная корреляция
Корреляция — это статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Математической мерой Корреляции двух случайных величин служит коэффициент Корреляции. Отношение между двумя или более рядами ценностей. Чем теснее связаны между собой две (или больше) серии, тем выше степень К. Так, управленец отдела торгово-промышленной деятельности страховой организации может поинтересоваться, существует ли К. между количеством недель подготовки, которую получает сотрудник отдела, и его средней дневной выработкой
Значения коэффициента К. располагаются по шкале от 0 до 1,00, характеризуя степень взаимоотношения от полного отсутствия К. до полной К. Когда r = 0,60, а r(2) = 0,36, то можно сказать, что 36% отклонения в переменной Y коррелируют с колебаниями в переменной Х; или же что 64% отклонения не коррелируют.
Анализ методом множественной регрессии учитывает одновременно отношение между всеми переменными, когда две или более независимых переменных используются для оценки зависимой переменной. Напр., управляющий может собрать следующую информацию о производстве компании:
- выработка на каждого работника в единицах;
- показатели тестирования на пригодность;
- стаж работников.
Метод анализа путем множественной регрессии может быть использован для оценки выработки каждого работника на основе данных теста на пригодность и стажа.
Частичная К. - это метод измерения чистой К. или частичной К. между одной независимой переменной и зависимой переменной, при котором элеминируется отношение с др. независимыми переменными. Этот показатель известен как коэффициент частичной К.
Некоторые виды коэффициентов Корреляции могут быть положительными или отрицательными (возможна также ситуация отсутствия статистической взаимосвязи — например, для независимых случайных величин). Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция — корреляция, при которой увеличение одной переменной связано с уменьшением другой переменной, при этом коэффициент Корреляции может быть отрицательным; положительная корреляция в таких условиях — корреляция, при которой увеличение одной переменной связано с увеличением другой переменной, при этом коэффициент Корреляции может быть положительным.
Автокорреляция — статистическая взаимосвязь между случайными величинами из одного ряда, но взятых со сдвигом, например, для случайного процесса — со сдвигом по времени. Рассмотрим следующую задачу. Была проведена серия измерений двух случайных величин X и Y, причем измерения проводились попарно: т.е. за одно измерение мы получали два значения - xi и yi . Имея выборку, состоящую из пар (xi , yi ), мы хотим определить, имеется ли между этими двумя переменными зависимость.
Зависимость между случайными величинами может иметь функциональный характер, т.е. быть строгим функциональным отношением, связывающим их значения. Однако при обработке экспериментальных данных гораздо чаще встречаются зависимости другого рода: статистические зависимости. Различие между двумя видами зависимостей состоит в том, что функциональная зависимость устанавливает строгую взаимосвязь между переменными, а статистическая зависимость лишь говорит о том, что распределение случайной величины Y зависит от того, какое значение принимает случайная величина X.
Одной из мер статистической зависимости между двумя переменными является коэффициент Корреляции. Он показывает, насколько ярко выражена тенденция к росту одной переменной при увеличении другой. Коэффициент Корреляции находится в диапазоне [-1, 1]. Нулевое значение коэффициента обозначает отсутствие такой тенденции (но не обязательно отсутствие зависимости вообще). Если тенденция ярко выражена, то коэффициент Корреляции близок к +1 или -1 (в зависимости от знака зависимости), причем строгое равенство единице обозначает крайний случай статистической зависимости - функциональную зависимость. Промежуточные значения коэффициента Корреляции говорят, что хотя тенденция к росту одной переменной при увеличении другой не очень ярко выражена, но в какой-то мере она все же присутствует. отличие от функциональной, корреляционная зависимость возникает тогда, когда один из признаков зависит не только от данного второго, но и от ряда случайных факторов или же когда среди условий, от которых зависят и тот и другой признаки, имеются общие для них обоих условия. Пример такого рода зависимости даёт корреляционная таблица. Из таблицы видно, что при увеличении высоты сосен в среднем растет и диаметр их стволов; однако сосны заданной высоты (например, 23 м) имеют распределение диаметров с довольно большим рассеянием. Если в среднем 23-метровые сосны толще 22-метровых, то для отдельных сосен это соотношение может заметным образом нарушаться. Статистическая К. в обследованной конечной совокупности наиболее интересна тогда, когда она указывает на существование закономерной связи между изучаемыми явлениями.
В основе теории К. лежит предположение о том, что изучаемые явления подчинены определённым вероятностным закономерностям (см. Вероятность, Вероятностей теория). Зависимость между двумя случайными событиями проявляется в том, что условная вероятность одного из них при наступлении другого отличается от безусловной вероятности. Аналогично, влияние одной случайной величины на другую характеризуется законами условных распределений первой при фиксированных значениях второй. Пусть для каждого возможного значения Х = х определено условное мат ожидание у (х) = Е (YIX = х) величины Y (см. Мат. ожидание). Функция у (х) называется регрессией величины Y по X, а её график — линией регрессии Y по X. Зависимость Y от Х проявляется в изменении средних значений Y при изменении X, хотя при каждом Х = х величина Y остаётся случайной величиной с определенным рассеянием. Пусть mY = Е (Y) — безусловное мат. ожидание Y. Если величины независимы, то все условные математические ожидания Y не зависят от х и совпадают с безусловными:
у (х) = Е (YIX = х) = Е (Y) = mY.
Обратное заключение не всегда справедливо. Для выяснения вопроса, насколько хорошо регрессия передаёт изменение Y при изменении X, используется условная дисперсия Y при данном значении Х = х или её средняя величина — дисперсия Y относительно линии регрессии (мера рассеяния около линии регрессии).
При строгой функциональной зависимости величина Y при данном Х = х принимает лишь одно определенное значение, то есть рассеяние около линии регрессии равно нулю.
Линия регрессии может быть приближённо восстановлена по достаточно обширной корреляционной таблице: за приближённое значение у (х) принимают среднее из тех наблюдённых значений Y, которым соответствует значение Х = х. На рисунке изображена приближённая линия регрессии для зависимости среднего диаметра сосен от высоты в соответствии с таблицей. В средней части эта линия, по-видимому, хорошо выражает действительная закономерность. Если число наблюдений, соответствующих некоторым значениям X, недостаточно велико, то такой метод может привести к совершенно случайным результатам. Так, точки линии, соответствующие высотам 29 и 30 м, ненадёжны ввиду малочисленности материала. См. Регрессия.
В случае К. двух количественных случайных признаков обычным показателем концентрации распределения вблизи линии регрессии служит корреляционное отношение , где — дисперсия Y (аналогично определяется корреляционное отношение , но между и нет какой-либо простой зависимости). Величина , изменяющаяся от 0 до 1, равна нулю тогда и только тогда, когда регрессия имеет вид у (x) = mY, в этом случае говорят, что Y некоррелирована с X, равняется единице в случае точной функциональной зависимости Y от X. Наиболее употребителен при измерении степени зависимости коэффициент Корреляции между Х и Y всегда —1 £ r £ 1. Однако практическое использование коэффициента К. в качестве меры зависимости оправдано лишь тогда, когда совместное распределение пары (X, Y) нормально или приближённо нормально (см. Нормальное распределение); употребление r как меры зависимости между произвольными Y и Х приводит иногда к ошибочным выводам, т. к. r может равняться нулю даже тогда, когда Y строго зависит от X. Если двумерное распределение Х и Y нормально, то линии регрессии Y по Х и Х по Y суть прямые у = mY+bY (x — mx) и х = mx+bx (у — mY), где и ; bY и bX именуются коэффициентами регрессии, причём
Так как в этом случае
Е (Y - y (x))2 = s2Y (1 - r2)
и
Е (Y - x (y))2 = s2X (1 - r2)
то очевидно, что r (корреляционные отношения совпадают с r2 полностью определяет степень концентрации распределения вблизи линий регрессии: в предельном случае r = ± 1 прямые регрессии сливаются в одну, что соответствует строгой линейной зависимости между Y и X, при r = 0 величины не коррелированы.
При изучении связи между несколькими случайными величинами X1,..., Xn пользуются множественными и частными корреляционными отношениями и коэффициентами К. (последними по-прежнему в случае линейной связи). Основной характеристикой зависимости являются коэффициенты rij — простые коэффициенты К. между Xi и Xj, в совокупности образующие корреляционную матрицу (rij) (очевидно, rij = rji и rkk = 1). Мерой линейной К. между X1 и совокупностью всех остальных величин X2,..., Xn служит множественный коэффициент К., равный при n = 3
Если предполагается, что изменение величин X1 и X2 определяется в какой-то мере изменением остальных величин X3,..., Xn, то показателем линейной связи между X1 и X2 при исключении влияния X3,..., Xn; является частный коэффициент К. X1 и X2 относительно X3,..., Xn, равный в случае n= 3
Множественные и частные корреляционные отношения выражаются несколько сложнее.
В математической статистике разработаны методы оценки упомянутых выше коэффициентов и методы проверки гипотез об их значениях, использующие их выборочные аналоги (выборочные коэффициенты К., корреляционные отношения и т. п.). Корреляция – это статистическая взаимосвязь случайных величин. И как утверждает всезнающая википедия, “часто заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи между парами признаков”.
В выделенной выше части среди представителей власти отдельных стран мира сего присутствует некое отсутствие знаний из курса старших классов средней школы. Хотя с другой стороны, с современных условиях новых норм причинно-следственная связь также не ведет к Корреляции. Например, в пятницу Национальный статистический офис Англии отличился неожиданным падением ВВП на 0.4% против ожидавшихся положительных 0.2%:
А в тот же день, Лондон оказался практически единственным рынком, закрывшемся в плюсе (и не только в Европе):
Так что не только исследователи часто не понимают природу Корреляции, но и действующие практики рынков акций часто заблуждаются. Хотя с третьей стороны, погрешность в 0.6% от ВВП в современных условиях новых норм – это всего лишь ошибка округления. Это вам скажет любое правительство. Но вернемся, как говорят французы, к нашим ложным Корреляциям…
Итак, на прошлой неделе главный шеф Центрального Банка Великобритании, сэр Мервин Кинг, заявил (страница 7, первый параграф, последнее предложение да и не только), что “частные фирмы, проходящие по мировой кодовой классификации как TBTF (too-big-to-fail), не имеют места в рыночной экономике”. А на фондовой бирже в Каире, Египет, торги по 26 акциям из индекса были остановлены самой биржей на основании того, что якобы рост стоимости акций не оправдан фундаментальными причинами. А во вторник Бразилия в целях ограничения необоснованных спекуляций ввела налог в 2% на все иностранные инвестиции в ценные бумаги. По мнение руководства страны избыточная ликвидность мировых финансовых рынков может навредить национальной экономике, и поэтому 2% в бюджет призваны компенсировать вредное влияние иностранных “инвесторов”.
Видимо, эти наивные неамериканцы не читали готовящиеся к публикации последние черновые работы, написанные трио, состоящем из бывшего научного сотрудника Принсетонского университета Бенджамина Шалома Бернанке, бывшего научного сотрудника Гарвардского университета Лоренса Генри Саммерса, а также практика международной экономики Тиммоти Франца Гайтнера. Данные научные работы, спонсируемые бывшим американским налогоплательщиком, а ныне безработным Джо-большая-упаковка, призваны показать всему миру преимущества новых экономических норм. В частности, они демонстрируют, что рост активов народного банка (желтая линия, вновь стремящаяся к небесам) и рост избыточных банковских резервов (белая линия, которая стремительно приближается к своему крупному юбилею - первому триллиону) являются очень хорошими индикаторами текущего здоровья рынка акций:
Избыточные резервы – это деньги, на которые банки вроде как должны были бы выдать займов экономике, но не выдали, потому что страшно! Поэтому лучше в акции, и тогда уже в следующем квартале можно будет показать выгода в разделе “торговые операции”, потому что до тех пор пока ФРС будет печатать деньги никакие исторические Корреляции не имеют значения. И в самом деле, зачем бояться покупать акции, если текущее значение VIX (индекса “страха”) исторически соответствовало значениям S&P500 в диапазоне 1350-1400 пунктов. Еще есть куда расти акциями, и не надо нам никакого страха!
А вот дохода нужны! Потому что каждый безработный в США сегодня в среднем проводит 26.2 недель (полгода!) перед тем, как ему или ей удается найти новую работу:
И 52.4% от всех неработающих в США уже исчерпали свои отведенные законом 26 недель, в течение которых они получают пособие по безработице. Кстати, это еще одна нарушенная корреляция. Потому что именно по этой причине падают требования на пособия по безработице, а уровень безработицы иногда даже радует колебаниями вниз, хотя пока еще чаще вверх:
И поэтому, если cенат США США в очередной (уже вроде четвертый) раз не продлит сроки пособия по безработице, то дополнительные 1.3 млн. американских “потребителей” лишатся денег до конца этого года, и, соответственно, платить по займам скоро станет некому. Но рынки акций все равно будут расти, потому что иностранцы будут продолжать усиленно обменивать бумажные американские “деньги” на твердые активы, пусть даже тоже американские, а “американские” организации будут рапортовать о растущем заграничном бизнесе и, соответственно, выгодах в бумажных американских “деньгах”:
Комментарий: вверху показан график Корреляции ежедневного изменения Индекса доллара (независимая переменная) против ежедневного изменения индекса S&P500 (зависимая переменная). Ломаная линия показывает регрессию индексов в двух сценариях: положительном и отрицательном закрытиям по Индексу доллара.
Соответственно доллар должен продолжать падать, если США хотят убедить себя и весь остальной мир в том, что все уже закончилось. Потому что вывод, который можно сделать из Корреляции доллара с акциями, состоит в том, что для роста акций на 1% доллар должен упасть на 1.83%, а падение акций на 1% соответствует росту доллара всего на 0.255%. Но самое страшное состоит в том, что аналогично ETF с рычагом, бесполезное колебание акций в узком диапазоне убивает цену доллара. И поэтому VIX, как мера волатильности и страха индекса S&P500, имеет право двигаться только в одном направлении – вниз, если США хотят оставить доллару хотя бы один шанс на выживание. На языке статистики корреляция – это соотношение между двумя единицами, рассчитанное на определённый отрезок времени. Корреляция измеряется в коэффициентах: от -1 (идеальная негативная корреляция) до 1 (идеальная позитивная корреляция). Позитивная корреляция предполагает, что две единицы двигаются в одном направлении, чем больше корреляция, тем четче и точнее прослеживаются данные движения. И наоборот, негативная корреляция представляет собой обратное движение, где соотношение двух единиц выражается движением в противоположных направлениях.
Важно понять, что на рынке Forex вы продаёте или покупаете пару валют, как одну единицу. Пара состоит из двух разных валют, а их стоимость основывается на цене одной из валют, разделённой стоимостью другой. Технически вы совершаете две торговых сделки, когда торгуете на Forex. Вы покупаете одну валюту и в то же время продаёте другую. Поэтому логично будет рассматривать куплю-торгово-промышленную деятельность пары валют, как две параллельные сделки.
Если бы сравнили некоторые из самых популярных пар валют на Forex, вы бы сразу же заметили сходство в их линии движения. Напр., EUR - JPY и EURUSD/
Этому есть простое объяснение: в обоих парах вы покупаете евро и продаёте другую валюту.
Коэффициент Корреляции
Коэффициент Корреляции или парный коэффициент Корреляции в теории вероятностей и статистике — это показатель характера взаимного стохастического влияния изменения двух случайных величин. Коэффициент Корреляции обозначается латинской буквой R в математической статистике (r в статистике) и может принимать значения от −1 до +1. Если значение по модулю находится ближе к 1, то это означает наличие сильной связи, а если ближе к 0 — связь слабая или вообще отсутствует. При коэффициенте Корреляции равном по модулю единице говорят о функциональной связи, то есть изменения двух величин можно описать математической функцией.
В различных прикладных отраслях (социологии, демографии, медицине, физике, химии, экономике и др.) приняты разные границы интервалов для оценки тесноты и значимости связи.
Коэффициент Корреляции Пирсона
Для метрических величин применяется коэффициент Корреляции Пирсона, точная формула которого была введена Фрэнсисом Гальтоном:
Пусть X,Y — две случайные величины, определённые на одном вероятностном пространстве. Тогда их коэффициент Корреляции задаётся формулой:
где cov — ковариация, D — дисперсия.
Развернутый вариант формулы:
где — мат ожидание.
Для графического представления подобной связи можно использовать прямоугольную систему координат с осями, которые соответствуют обеим переменным. Каждая пара значений маркируется при помощи определенного символа. Такой график называется «диаграммой рассеяния».
Метод вычисления коэффициента Корреляции зависит от вида шкалы, к которой относятся переменные. Так, для измерения переменных с интервальной и количественной шкалами необходимо использовать коэффициент Корреляции Пирсона (корреляция моментов произведений). Если по меньшей мере одна из двух переменных имеет порядковую шкалу, либо не является нормально распределённой, необходимо использовать ранговую Корреляцию Спирмена или τ (тау) Кендала. В случае, когда одна из двух переменных является дихотомической, используется точечная двухрядная корреляция, а если обе переменные являются дихотомическими: четырёхполевая корреляция. Расчёт коэффициента Корреляции между двумя недихотомическими переменными не лишён смысла только тогда, кода связь между ними линейна (однонаправлена). Существует несколько различных коэффициентов Корреляции, к каждому из которых относится сказанное выше. Наиболее широко известен коэффициент Корреляции Пирсона, характеризующий степень линейной зависимости между переменными. Он определяется, как
Этот коэффициент Корреляции вычисляется подпрограммой PearsonCorrelation.
Используя этот коэффициент, следует учитывать, что лучше всего он подходит для оценки взаимосвязи между двумя нормальными переменными. Если распределение переменных отличается от нормального, то он по-прежнему продолжает характеризовать степень взаимосвязи между ними, но к нему уже нельзя применять методы проверки на значимость. Также коэффициент Корреляции Пирсона не очень устойчив к выбросам - при их наличии можно ошибочно сделать вывод о наличии Корреляции между переменными. Поэтому если распределение исследуемых переменных отличается от нормального или возможны выбросы, то лучше воспользоваться непараметрическим аналогом - коэффициентом ранговой Корреляции Спирмена. Корреляция представляет собой меру зависимости переменных. Наиболее известна корреляция Пирсона. При вычислении Корреляции Пирсона предполагается, что переменные измерены, как минимум, в интервальной шкале. Некоторые другие коэффициенты Корреляции могут быть вычислены для менее информативных шкал. Коэффициенты Корреляции изменяются в пределах от -1.00 до +1.00. Обратите внимание на крайние значения коэффициента Корреляции. Значение -1.00 означает, что переменные имеют строгую отрицательную Корреляцию. Значение +1.00 означает, что переменные имеют строгую положительную Корреляцию. Отметим, что значение 0.00 означает отсутствие Корреляции.
Наиболее часто используемый коэффициент Корреляции Пирсона r называется также линейной Корреляцией, т.к. измеряет степень линейных связей между переменными.
Корреляция Пирсона (далее называемая просто Корреляцией) предполагает, что две рассматриваемые переменные измерены, по крайней мере, в интервальной шкале. Она определяет степень, с которой значения двух переменных "пропорциональны" друг другу. Важно, что значение коэффициента Корреляции не зависит от масштаба измерения. Например, корреляция между ростом и весом будет одной и той же, независимо от того, проводились измерения в дюймах и англиских Фунтах стерлингов или в сантиметрах и килограммах. Пропорциональность означает просто линейную зависимость. Корреляция высокая, если на графике зависимость "можно представить" прямой линией (с положительным или отрицательным углом наклона).
Подготовка
Для проведения данной процедуры необходимо вызвать команду статистика→Основная статистика/Таблицы→Линейная корреляция (Пирсона)....
Результаты
Результатом является матрица коэффициентов Корреляции (r).
Наиболее часто используемый коэффициент Корреляции Пирсона r (Pearson, 1896) называется также линейной Корреляцией (термин корреляция впервые ввел Galton, 1888), т.к. измеряет степень линейных связей между переменными. Можно сказать, что корреляция определяет степень, с которой значения двух переменных пропорциональны друг другу. Важно, что значение коэффициента Корреляции не зависит от масштаба измерения. Например, корреляция между ростом и весом будет одной и той же, независимо от того, проводились измерения в дюймах и Фунтах стерлингов или в сантиметрах и килограммах. Пропорциональность означает просто линейную зависимость. Корреляция высокая, если на графике зависимость можно представить прямой линией (с положительным или отрицательным углом наклона). Проведенная прямая называется прямой регрессии или прямой, построенной методом наименьших квадратов. Последний термин связан с тем, что сумма квадратов расстояний (вычисленная по оси Y) от наблюдаемых точек до прямой является минимальной из всех возможных. Заметим, что использование квадратов расстояний приводит к тому, что на оценки параметров сильно влияют выбросы. Корреляция Пирсона предполагает, что две рассматриваемые переменные измерены, по крайней мере, в интервальной шкале.
Ho показывает принята или нет нулевая гипотеза (гипотеза об отсутствии связи между двумя переменными в популяции). Нулевая гипотеза отвергается если тестовая статистика больше или равна критическому значению.
Критическое значение - критическое значение тестовой статистики, равно значению распределения Стьюдента с N-2 степенями свободы для текущего уровня значимости.
Как интерпретировать значения Корреляций. Коэффициент Корреляции Пирсона (r) представляет собой меру линейной зависимости двух переменных. Если возвести его в квадрат, то полученное значение коэффициента детерминации r2) представляет долю вариации, общую для двух переменных (иными словами, "степень" зависимости или связанности двух переменных). Чтобы оценить зависимость между переменными, нужно знать как "величину" Корреляции, так и ее значимость.
Значимость Корреляций. Уровень значимости, вычисленный для каждой Корреляции, представляет собой главный источник информации о надежности Корреляции. Как объяснялось выше (см. Элементарные понятия статистики), значимость определенного коэффициента Корреляции зависит от объема выборок. Критерий значимости основывается на предположении, что распределение остатков (т.е. отклонений наблюдений от регрессионной прямой) для зависимой переменной y является нормальным (с постоянной дисперсией для всех значений независимой переменной x). Исследования методом Монте-Карло показали, что нарушение этих условий не является абсолютно критичным, если размеры выборки не слишком малы, а отклонения от нормальности не очень большие. Тем не менее, имеется несколько серьезных опасностей, о которых следует знать, для этого см. следующие разделы.
Выбросы. По определению, выбросы являются нетипичными, резко выделяющимися наблюдениями. Так как при построении прямой регрессии используется сумма квадратов расстояний наблюдаемых точек до прямой, то выбросы могут существенно повлиять на наклон прямой и, следовательно, на значение коэффициента Корреляции. Поэтому единичный выброс (значение которого возводится в квадрат) способен существенно изменить наклон прямой и, следовательно, значение Корреляции. Заметим ,что если размер выборки относительно мал, то добавление или исключение некоторых данных (которые, возможно, не являются "выбросами", как в предыдущем примере) способно оказать существенное влияние на прямую регресии (и коэффициент Корреляции). Это показано в следующем примере, где мы назвали исключенные точки "выбросами"; хотя, возможно, они являются не выбросами, а экстремальными значениями.
Количественный подход к выбросам. Некоторые исследователи применяют численные методы удаления выбросов. Например, исключаются значения, которые выходят за границы ±2 стандартных отклонений (и даже ±1.5 стандартных отклонений) вокруг выборочного среднего. В ряде случаев такая "чистка" данных абсолютно необходима. Например, при изучении реакции в когнитивной психологии, даже если почти все значения экспериментальных данных лежат в диапазоне 300-700 миллисекунд, то несколько "странных времен реакции" 10-15 секунд совершенно меняют общую картину. К сожалению, в общем случае, определение выбросов субъективно, и решение должно приниматься индивидуально в каждом эксперименте (с учетом особенностей эксперимента или "сложившейся практики" в данной области). Следует заметить, что в некоторых случаях относительная частота выбросов к численности групп может быть исследована и разумно проинтерпретирована с точки зрения самой компании эксперимента
Нелинейные зависимости между переменными. Другим возможным источником трудностей, связанным с линейной Корреляцией Пирсона r, является форма зависимости. Корреляция Пирсона r хорошо подходит для описания линейной зависимости. Отклонения от линейности увеличивают общую сумму квадратов расстояний от регрессионной прямой, даже если она представляет "истинные" и очень тесные связи между переменными.
Коэффициент ранговой Корреляции Кенделла
Применяется для выявления взаимосвязи между количественными или качественными показателями, если их можно ранжировать. Значения показателя X выставляют в порядке возрастания и присваивают им ранги. Ранжируют значения показателя Y и рассчитывают коэффициент Корреляции Кенделла:
где S = P − Q.
P — суммарное число наблюдений, следующих за текущими наблюдениями с большим значением рангов Y.
Q — суммарное число наблюдений, следующих за текущими наблюдениями с меньшим значением рангов Y. (равные ранги не учитываются!)
Если исследуемые данные повторяются (имеют одинаковые ранги), то в расчетах используется скорректированный коэффициент Корреляции Кенделла:
t — число связанных рангов в ряду X и Y соответственно.
Коэффициент ранговой Корреляции Спирмена
Каждому показателю X и Y присваивается ранг. На основе полученных рангов рассчитываются их разности d и вычисляется коэффициент Корреляции Спирмена: Если заменить значения переменных в выборке их рангами и рассчитать коэффициент Корреляции Пирсона для полученной выборки, то мы получим непараметрический коэффициент Корреляции - коэффициент ранговой Корреляции Спирмена. В отличие от коэффициента Корреляции Пирсона, он характеризует степень произвольной нелинейной зависимости между переменными в рамках модели "рост одной переменной приводит к росту другой". Этот коэффициент Корреляции вычисляется при помощи подпрограммы SpearmanRankCorrelation.
Следует отметить, что коэффициент Корреляции Спирмена может использоваться для оценки зависимости между переменными независимо от их распределения. Это важное качество достигается благодаря тому, что все специфичные для конкретных распределений детали исчезают, когда значения переменных заменяются их рангами в выборке. Также он менее чувствителен к выбросам, что является ещё одним важным качеством при обработке экспериментальных данных.
Коэффициент Корреляции знаков Фехнера
Подсчитывается количество совпадений и несовпадений знаков отклонений значений показателей от их среднего значения.
U — число пар, у которых знаки отклонений значений от их средних совпадают.
V — число пар, у которых знаки отклонений значений от их средних не совпадают.
Коэффициент множественной ранговой Корреляции (Конкордации)
m — число групп, которые ранжируются.
n — число переменных.
Rij — ранг i-фактора у j-единицы.
Значимость:
, то гипотеза об отсутствии связи отвергается.
В случае наличия связанных рангов:
Биссериальный коэффициент
Свойства коэффициента Корреляции
Неравенство Коши — Буняковского:
если принять в качестве скалярного произведения двух случайных величин ковариацию , то норма случайной величины будет равна , и следствием неравенства Коши — Буняковского будет:
Коэффициент Корреляции равен тогда и только тогда, когда X и Y линейно зависимы (исключая события нулевой вероятности, когда несколько точек «выбиваются» из прямой, отражающей линейную зависимость случайных величин):
где . Более того в этом случае знаки и k совпадают:
Если X,Y независимые случайные величины, то . Обратное в общем случае неверно.
Корреляционный анализ
Корреляционный анализ — метод обработки статистических данных, заключающийся в изучении коэффициентов Корреляции между переменными. При этом сравниваются коэффициенты Корреляции между одной парой или множеством пар признаков для установления между ними статистических взаимосвязей.
Цель корреляционного анализа — обеспечить получение некоторой информации об одной переменной с помощью другой переменной. В случаях, когда возможно достижение цели, говорят, что переменные коррелируют. В самом общем виде принятие гипотезы о наличии Корреляции означает что изменение значения переменной А, произойдет одновременно с пропорциональным изменением значения Б.
Корреляция отражает лишь линейную зависимость величин, но не отражает их функциональной связности. Например, если вычислить коэффициент Корреляции между величинами A = sin(x) и B = cos(x), то он будет близок к нулю, то есть зависимость между величинами отсутствует. Между тем, величины A и B очевидно связаны функционально по закону sin2(x) + cos2(x) = 1.
Ограничения корреляционного анализа
Графики распределений пар (x, y) с соответствующими коэффициентами Корреляций x и y для каждого из них. Обратите внимание, что коэффициент Корреляции отражает «зашумлённость» линейной зависимости (верхняя строка), но не описывает наклон линейной зависимости (средняя строка), и совсем не подходит для описания сложных, нелинейных зависимостей (нижняя строка).
Применение возможно в случае наличия достаточного количества случаев для изучения: для конкретного вида коэффициента Корреляции составляет от 25 до 100 пар наблюдений.
Второе ограничение вытекает из гипотезы корреляционного анализа, в которую заложена линейная зависимость переменных. Во многих случаях, когда достоверно известно, что зависимость существует, корреляционный анализ может не дать результатов просто ввиду того, что зависимость нелинейна (выражена, например, в виде параболы).
Сам по себе факт корреляционной зависимости не даёт основания утверждать, какая из переменных предшествует или является причиной изменений, или что переменные вообще причинно связаны между собой, например, ввиду действия третьего фактора.
Область применения
Данный метод обработки статистических данных весьма популярен в экономике и социальных науках (в частности в психологии и социологии), хотя сфера применения коэффициентов Корреляции обширна: контроль качества промышленной продукции, металловедение, агрохимия, гидробиология, биометрия и прочие.
Популярность метода обусловлена двумя моментами: коэффициенты Корреляции относительно просты в подсчете, их применение не требует специальной математической подготовки. В сочетании с простотой интерпретации, простота применения коэффициента привела к его широкому распространению в сфере анализа статистических данных.
Ложная корреляция
Часто заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи между парами признаков, в то время как коэффициенты Корреляции устанавливают лишь статистические взаимосвязи.
В современной количественной методологии социальных наук, фактически, произошел отказ от попыток установить причинно-следственные связи между наблюдаемыми переменными эмпирическими методами. Поэтому, когда исследователи в социальных науках говорят об установлении взаимосвязей между изучаемыми переменными, подразумевается либо общетеоретическое допущение, либо статистическая зависимость.
Частная корреляция
Если исследовать достаточно большую совокупность мужчин и сопоставить размер их обуви с уровнем образованности, то между этими двумя переменными можно заметить хоть и небольшую, но в то же время значимую Корреляцию. Это корреляция может послужить примером так называемой ложной Корреляции. Здесь статистически значимый коэффициент Корреляции является не проявлением некоторой причинной связи между двумя рассматриваемыми переменными, а в большей степени обусловлен некоторой третьей переменной.
В рассматриваемом примере такой переменной является рост. С одной стороны существует некоторая незначительная корреляция между ростом и уровнем образованности, а с другой — вполне объяснимая и логичная связь между ростом и размером обуви. Вместе эти две Корреляции приводят к упоминавшейся ложной Корреляции. Для исключения одной такой искажающей переменной необходим расчёт так называемой частной Корреляции.
Если присвоить коррелирующим переменным индексы 1 и 2, а искажающей переменной — индекс 3, и попарно рассчитать корреляционный коэффициент (Пирсона) r12,r13, и r23 , то для частных корреляционных коэффициентов получим:
Достаточно давно в социологических исследованиях, проводимых в германии, выяснялось отношение населения к приезжим рабочим-иностранцам. Для этого было сформулировано несколько отдельных вопросов. Ответы на вопросы суммировались. Сумма могла принимать значения от 0 до 30, причём большее значение соответствует более негативному отношению к приезжим рабочим.
Среди многочисленных дополнительных переменных учитывались: возраст опрашиваемых и частота посещения церкви. Последней характеристике были присвоены значения от 1 (никогда) до 6 (по меньшей мере, 2 раза в неделю). Мы обработали небольшую выборку из оригинальных данных опроса (35 респондентов с этими тремя переменными).
Если рассмотреть Корреляции между этими тремя переменными, то при выборе коэффициентов Пирсона для анализа взаимосвязи, получатся следующие результаты (закроем глаза на то, что одна из переменных, а именно частота посещения церкви, имеет порядковую шкалу):
"* Correlation is significant at the .01 level (2-tailed). Корреляция является значимой на уровне 0,01 (2-стороння).
Принимая во внимание полярность, полученные результаты можно трактовать, к примеру, таким образом, что частые посещения церкви коррелируют с отрицательным отношением к приезжим рабочим (r = 0,432). Прежде, чем поставить в упрёк церкви враждебность по отношению к иностранцам, нужно учесть влияние возраста. Он также коррелирует с враждебным отношением к иностранным рабочим (r = 0,468) и сильно коррелирует с частотой посещения церкви (r = 0.779). Таким образом, возникает подозрение, что возраст является искажающим признаком, виновным в ложной Корреляции между частотой посещения церкви и отрицательным отношением к иностранным рабочим. Докажем это путём расчёта частных корреляционных коэффициентов.
Откроем файл данных.
Выберем в меню Analyse... (Анализ) Correlate... (Корреляция) Partial... (Частная)
Откроется диалоговое окно Partial Correlations (Частные Корреляции).
Перенесем переменные gast и kirche в поле признаков, а переменную alter в поле контрольных переменных и оставим предварительную установку для двухстороннего теста значимости.
При помощи щелчка на кнопке Options... (Опции) наряду с традиционной обработкой пропущенных значений, можно организовать расчёт среднего значения, стандартного отклонения и вывод «Корреляций нулевого порядка» (то есть простых корреляционных коэффициентов).
В случае одной искажающей переменной, как в приведенном примере, возможен расчёт частной Корреляции первого порядка, при наличии нескольких искажающих переменных, SPSS выдаёт Корреляции высших порядков.
Начнем расчёт щелчком на кнопке ОК. В окне просмотра появится следующий результат:
Partial Correlation coefficients (Частичные корреляционные коэффициенты)
Controlling for... A (Контрольная переменная) (
LTER Возраст)
GAST (Приезжий) GAST
( Приезжий)
1,0000 ( 0)
P= ,
KIRCHE (Церковь)
,1215 ( 32)
P= ,494
KIRCHE (Церковь) ,1215 ( 32)
P= ,494
1,0000 ( 0)
P= ,
Вас, возможно, удивит, что в данном случае всё ещё выводится старый вариант таблицы результатов, соответствующий прежним версиям SPSS. Результаты включают: частный корреляционный коэффициент, число степеней свободы (число наблюдений минус 3) и уровень значимости. Исходя из полученных результатов, можно сделать вывод, что при исключении искажающей переменной alter больше не наблюдается существенной Корреляции между частотой посещения церкви и отрицательным отношением к иностранным рабочим.
Корреляция между валютами
Мы представляем в данной статье исследование величины Корреляции между движениями различных валют на январь. Как уже многие обратили внимание, Корреляции между различными валютными парами изменяются через какое-то время, поэтому чрезвычайно важно регулярно следовать изменениям в Корреляции. В представляемый обзор мы включили 3 месячные и 1-летние Корреляции, чтобы биржевые спекулянты могли лучше почувствовать исторические тенденции и добавили 6-месячные скользящие Корреляции в качестве дальнейшего подтверждения результатов Корреляции.
Чтобы быть эффективным биржевым спекулянтом, также важно понимать, как различные валютные пары двигаются относительно друг друга. Существует несколько причин, почему это существенно, но наиболее важно то, что это позволяет биржевым спекулянтам понимать тот риск, которому они подвергаются. Например, портфель, состоящий из EUR USD и NZD - USD отличается от портфеля, состоящего из EUR USD и USD / CHF. Как показано в таблицах ниже, за прошлые шесть месяцев, курс EUR USD имел сильную положительную Корреляцию (+0.94) с NZD / USD и сильную отрицательную Корреляцию с USD CHF (-0.85). Поэтому наличие длинной позиции по EUR USD и длинной по Доллар - Франк привело бы в общем случае к отрицательной или почти нулевой выгоды, потому что при повышении курса EUR USD, курс Доллар - Швейцарский франк в большинстве случаев снижается. Конечно, эти две валюты имеют различные ценности одного пункта, так что соотношение профита к потерям может не быть совершенно точно нулевым. С другой стороны, удерживая длинную позицию по EUR USD и длинную по NZD USD, это было бы подобно удвоению позиции, поскольку корреляция была очень сильной. Кроме того, из представленных таблиц, мы можем увидеть, что Корреляции изменяются со временем. Если валютные валютной пары EUR USD и GBP - USD имели сильную положительную Корреляцию в долгосрочном периоде (то есть 6-месячный и 1-летний период), корреляция не была столь сильной в прошлом месяце (-0.18). Зная об этом, биржевые торговцы могут эффективно диверсифицировать и управлять своими портфелями.
Изменения, подобно этим, можно частично объяснить изменениями денежно-кредитной политики или изменениями внутренних условий. Для Британии, ожидания изменения денежно-кредитной политики в сторону возможности снижения ставок подтолкнули биржевых спекулянтов к закрытию длинных позиций по GBP / USD, усиливая движения валютной пары и приводя к нарушению ее Корреляции с EUR USD.
Независимо от вашей торговой стратегии и вашего намерения диверсифицировать свои позиции или найти дополнительные валютные пары для торговой деятельности, очень важно иметь в виду Корреляцию между различными валютными парами и тенденции их изменения. Биржевому спекулянту, работающему на валютный рынок Forex, необходимо быть уверенным в характеристиках валютного рынка. Без знания основных тенденций той или иной валютной пары, спекулянты на биржевом рынке подвергают себя неоправданному риску. Один из самых мощных инструментов для анализа конъюнктуры рынка, которым может вооружиться биржевой спекулянт на валютном рынке Forex, это историческая корреляция между валютными парами. Понимание закономерностей Корреляции позволяет биржевыми спекулянтами не только хеджировать позиции, но и может подсказать момент для открытия сделки.
Термин «корреляция» используется для описания взаимоотношения между двумя связанными переменными. Математически корреляция выражается в диапазоне от +1 до -1. Корреляция +1 означает, что переменные полностью коррелируют, т.е. что движение на 1 пункт по одной валютной паре на другом валютном сегменте также сопровождается движением на 1 пункт в том же самом направлении. Корреляция -1 означает, что две валютные пары движутся в полностью противоположном направлении. Корреляция равная 0 указывает на независимое движение валютных пар и отсутствие в нем взаимосвязи.
Обладание информацией о точной взаимосвязи между валютами бесценно. Многие торговцы на биржевом рынке сравнивают графики, накладывая их друг на друга, чтобы выявить Корреляцию, однако намного более точным будет определение Корреляции при помощи вычислений. Кроме того, хотя и не все это признают, анализ «на глаз» является субъективным и далеко не всегда отражает истинную картину на рынке. Самый простой способ определения Корреляции – расчета при помощи пакета анализа данных Microsoft Excel.
Microsoft Excel позволяет анализировать Корреляцию между двумя валютными парами простым щелчком мыши. Сложность анализа заключается по большей степени в получении данных, а не в их обработке. Если вы имеете доступ к историческим данным, вы можете просто скопировать и вставить их в соответствующую колонку Microsoft Excel. Цены закрытия можно использовать как для дневных, так и для внутредневных диапазонов, главное, чтобы выбранный диапазон совпадал для обеих валютных пар.
После того, как вы разделили данные по двум отдельным колонкам, убедитесь, что программа готова к статистическому анализу. Для этого необходимо зайти в меню Tools и нажать на опцию Data Analysis в выпадающем меню. Если вы не видите Data Analysis, необходимо загрузить пакет для анализа данных, выбрав Add-Ins в том же самом меню. После этого кликните по Analysis Toolpak и следуйте инструкциям.
Теперь выделенные данные готовы для Корреляции. Кликнув по меню Tools, выберете в выпадающем меню опцию Data Analysis. Выберете ее. Перед вами появится окно, в который необходимо ввести «входной диапазон». Другими словами, вам надо ответить, какие данные будут учитываться в анализе. Убедитесь в том, что вы выбрали колонки, а не ряды групп данных. Кликните мышью и протяните ее по данным, которые будут подвергаться анализу, после чего нажмите OK. Результатом будет таблица, в которой будет определен коэффициент Корреляции между двумя валютными парами.
Как было отмечено выше, коэффициент Корреляции будет находиться в диапазоне от +1 до -1. +1 указывает на полную позитивную Корреляцию, тогда как – 1 на полную негативную Корреляцию. На приведенном внизу примере видно, что для выбранного периода позитивная корреляция валюты Швейцарии и евро составила .9667. Это и не удивительно, хорошо известно, что две эти валютные пары часто двигаются в тандеме. Для наглядности можно нанести полученные данные на график, выбрав опцию Chart. График намного лучше демонстрирует Корреляцию между валютными парами. Если на графике видна наклонная восходящая диагональная линия – значит две переменных положительно коррелируют друг с другом. Если на графике видно наклонная нисходящая диагональная линия, значит корреляция между двумя переменными негативная. Случайное распределение точек на графике, на котором нельзя увидеть определенных фигур, указывает на отсутствие Корреляции между парами. Корреляция инвестиционных активов является важной характеристикой для оценки актива с целью включения его в портфель. «Это мера, предназначенная для оценки статической зависимости между двумя временными рядами, например доходности некоторого актива и средней рыночной доходности».
Согласно теории ценообразования на капитальные активы (САРМ), премия за риск по активу зависит от параметра «бета» (степени изменчивости актива по отношению к рынку), который, в свою очередь, зависит от перемещений этого актива вместе с портфелем. Чтобы установить премию за риск по тому или иному классу активов, надо оценить, до какой степени взаимосвязаны эти параметры. Такой оценкой является коэффициент Корреляции. Это статистическая мера степени Корреляции между двумя временными рядами показателей, например ценами на акции в США и Мексике. Коэффициент Корреляции принимает значение от минус единицы, что отражает полную отрицательную зависимость, до плюс единицы, что означает, что эти ряды абсолютно положительно зависимы. Нулевая корреляция означает, что ценовые вариации в двух странах абсолютно не связаны. Чем меньше коэффициент Корреляции, тем значительнее прибытка от диверсификации. Временные ряды цен акций в различных странах в общем положительно коррелируются, но коэффициент Корреляции обычно значительно ниже единицы.
В связи с тем что рынок акций США представляет собой значительную часть мирового рынка, коэффициент Корреляции американского рынка с мировым сравнительно высокий. Это действительно так, хотя на протяжении ряда лет этот показатель, судя по всему, понижался по мере того, как большее значение приобретали рынки других стран. А это означает, что дальнейшее расширение мирового инвестиционного рынка будет способствовать увеличению эффекта от диверсификации.
Растущая интеграция экономических систем и рынков не означает, что движения активов на разных рынках стали похожими. Из этой интеграции вытекает только то, что потоки капитала встречают сейчас на своем пути меньше препятствий. Многие замечали, что при росте одной валютной пары, другая стремительно падает, и, причем, помимо краткосрочного движения зеркально отражает движение этой пары.
Следует разобраться, почему это происходит и как это может помочь нам в продаже?
Если знать Корреляцию валютных пар, то полученную информацию можно использовать для эффективного управления своими средствами.
Для начала определим, что Корреляцией будем называть некое статистическое отношение между двумя ценными бумагами. Коэффициент Корреляции расположен между –1 и +1.
Когда корреляция показывает +1 – это означает, что 2 валютные пары 100% времени двигаются в одном и том же направлении. И, наоборот, при значении –1 – можно сказать, что 2 валютные пары 100% своего времени двигаются в противоположных направлениях.
Нулевое же значение сигнализирует об отсутствии закономерности движения между валютными парами.
Корреляцию определить легко.
Существует так называемый вариант «на глаз» путем наложения графика друг на друга. Этот прием больше является субъективным, и часто может приводить к ошибочным действиям.
Например, если я покупаю валютную пару EUR / JPY. То фактически я совершаю операции с парами: EURUSD и USD - JPY (рис.1). Но это элементарный пример, объясняющий, что все валюты существуют парами.
Но существуют ещё более сложные корреляционные зависимости, которые можно вычислить.
Для того, чтобы рассчитать зависимость между валютными парами вам понадобиться Microsoft Exel и несколько простых операций.
Для терминала Rate Streamer – это будет выглядеть так:
1. Задаем необходимый период для анализа.
2. Открываем файл – сохранить как…
3. Открываем Microsoft Exel
4. Данные – внешние данные – импорт текстового файла – загрузка сохраненных ранее котировок
Редактируете – и вот готовые исторические котировки, необходимые для анализа.
Правило расчета Корреляции:
1. Выбрать необходимые для анализа валютные пары
2. Определить необходимый период для анализа
3. Создайте две колонки для каждой пары, заполните их
4. Под одной из колонок напишите функцию Корреляции CORREL
5. Выделите анализируемый временной диапазон через запятую
Должна получить формула типа: КОРРЕЛ или CORREL (A1:А50, В1:В50)
6. Число, которое получиться, и есть долгожданная корреляция.
Электронная корреляция
Электронная корреляция, взаимная обусловленность движений всех электронов атомной или молекулярной системы как целого. Определяется электростатич. отталкиванием электронов (кулоновская корреляция) и статич. особенностями системы, в частности принципом Паули (фермиевская корреляция). Полный учет электронной Корреляции при расчете энергии и определении электронной структуры системы достигается -конфигурационного взаимодействия методом. В зависимости от того, какую форму волновой ф-ции молекулы и ее ионов применяют, различают статич., динамич., внутри- и межоболочечную электронную Корреляцию.
Широко используемый метод молекулярных орбиталей учитывает лишь фермиевскую Корреляцию, поэтому все отклонения в поведении реальных систем от описываемого этим методом связывает с кулоновской электронной Корреляцией. В этом случае электронную Корреляцию (в более узком смысле) характеризуют корреляц. энергией - разностью точной энергии системы и энергии, определенной методом мол. орбиталей.
Электронную Корреляцию учитывают прежде всего при исследовании возбужд. состояний молекул, диссоциации и др., а также при анализе электронной структуры отрицат. мол. ионов. Особенно заметны корреляц. эффекты при вырождении энергетич. уровней молекул. Говоря о том, что некие процессы или явления коррелируют друг с другом или одно из них составляет причину другому, говорим ли мы о том же самом типе условий образующейся связи или выделяем различие условий? Что такое в философской семантике "корреляция" и что такое "причинность", и каково, если они не одинаковы, их соотношение? Можно ли относительно некоторых одних и тех же связей говорить, что они частично причинны и частично коррелятивны, или данным категориям свойственно стойкое несродство и не смешиваемость друг с другом?
Очерченная в нашей преамбуле группа проблем и будет предметом нашего исследования семантических категорий "причинность" и "корреляция". И начнем мы наш анализ приведением примера, понимаемого нами в качестве эталона "чистой" Корреляции. Положим, мы располагаем некими идеальными часами, только лишь отсчитывающими время, то есть переходящими по определенной цепи состояний, и не испытывающими старения. Практическим образцом таких часов можно мыслить, в частности, современные электронные часы со стабильно сохраняющими свои качества элементами схемы. И при этом у нас существует некий процесс фазированной во времени химической реакции, например, затвердевание клея или схватывание цемента, о фазах которого мы и будем судить по показаниям подобных "идеальных часов".
Некое положение индикаторов на этих наших часах говорит нам о том, что наступил момент одного из состояний протекающей химической реакции, в то же время никак не раскрывая нашему сознанию собственно причину подобного выпадения условий данного события. Показанная в нашем примере параллельно прилагаемая индикативность и будет носить у нас имя корреляция. Корреляцией мы будем признавать условие полноты аналогии по некоему признаку, когда для узнавания выпадения условий в одной отождествляемой условности достаточно знания порядка их выпадения в другой. Корреляция не обязательно относится только к процессам, но присуща любым видам аналогизируемых зависимостей, такова, например, корреляция карты и местности, распространения одного светового конуса и другого, признаков одной революционной ситуации и другой и т.п.
Для сущности, в отношении которой имеет место другая коррелятивно связанная с ней сущность, не важно, существует ли этот отождествляемый элемент или нет - коррелирующая сущность представлена в бытии самой по себе. Земная поверхность существует, не взирая на то, нанесло ли человечество ее отображение на карты или этот участок Земли никак не описан. Другое отношение - невосполняемой утраты - присуще следствиям, порождаемым данной причиной. Тип некоего устройства, способного оставлять след на бумаге, мы называем именем "карандаш". Если сделать подобное устройство, полностью соответствующее карандашу по внешнему виду, размеру и сугубо механической комбинации компонентов, но не включить в него ни одного элемента, способного оставлять след на бумаге, то здесь собственно функция карандаша безвозвратно утрачивается.
То положение вещей, в котором предназначение некоего участвующего элемента определяет само данное положение вещей, мы будем называть причинно зависимым от такого элемента. Если устранение в некоем сооружении подпорки ведет к обрушению сооружения, то отсюда можно понимать подпорку условием, причинно влияющим на устойчивость такого сооружения. Но из чего именно следует та проявленная нами осторожность, не позволившая нам утверждать, что подпорка является причиной устойчивости сооружения как такового?
Для нас невозможно с очевидностью сказать, что в составе сооружения отсутствует любые иные элементы, устранение которых способно вести к потере этим сооружением устойчивости. Причинная связь, таким образом, в своей исходной форме представляет собой установление некоей частной зависимости, отмена которой не позволяет обеспечить некое стабильное воспроизводство известного результата. С другой стороны, участие именно этой зависимости в задаче воспроизводства искомого результата напрямую не означает достаточности здесь только такого участия. А тогда, следовательно, если некий результат требует от нас введения не одной, а группы отдельных причин, то из данного положения нельзя сделать иного вывода, кроме того, что данный результат обеспечивает корреляция ряда отдельных независимых причин.
Итак, как мы выяснили, если для состояния Корреляции невозможно пересечение границ общности причинного поля (наш поиск "чистой" Корреляции требовал причинного "разведения" коррелирующих сущностей), то причинность тесно связана Корреляцией с подкрепляющей (способствующей, обеспечивающей) причинностью. Подобное положение вещей заставляет нас говорить о недостаточности норм формальной логики по отношению к задаче описания отношений любой формации действительности, и о том, что действительность приемлет никак не чисто причинные и не чисто коррелятивные, а только комбинированные причинно-коррелятивные связи (отношения).
Но, поскольку всякое наделенное связанностью отношение действительности оказалось комбинацией двух упомянутых нами базисных нормативов, то появляется логико-семантическая проблема описания отношений, присущих самой данной комбинации. Какие способы и методики мы можем выбрать для описания нормы причинно-коррелятивной обусловленности, характерной именно для данного строго связанного отношения?
В поиске ответа на данный вопрос невозможно не удостоить нашим вниманием тот момент, что нам не всегда доступна возможность выделения полного комплекса причин рассматриваемого случая, и не по причине ошибочности или нарочитого огрубления, а часто по причине отсутствия в нашей концепции отдельного понимания некоей сферы природы (действительности). Например, химия, не понимавшая в прошлом электрической природы химизма, замещала анализ электронных связей в молекулах грубой категорией "химическое сродство". Поэтому перед началом анализа нормативности причинно-коррелятивной обусловленности необходима регистрация данного случая как относящегося к некоему условно "полному" (хотя и вводимому нами сейчас ради решения стоящей перед нами задачи) набору "природ".
По отношению к подобной условной базе, которую мы можем назвать "системой природ", наш анализ способен рассматривать некие случаи действительности на основании фактов включенности или совмещенности их процедур как коррелирующие между собой или же как связанные причинно-следственной связью. При этом "чистый" случай Корреляции будет возможен именно тогда, когда наша "картина природ" выделяет некие две области как полностью независимые друг от друга (взаимно изолируя, например, "математику" и "мифологию"), а "чистый" случай причинности - когда все условия некоей результативности полностью включены в некий набор "природ", определенный для порождения этого результата как "исходный".
Поэтому, если понимать логику производной семантики, а семантику - производить от онтологической картины в целом, то саму присущую логике возможность образования "формальных" или "свободных" связей нужно понимать наследующей созданному онтологией облику многообразия действительности. Например, можно мыслить две онтологии - одну понимающую идеальное в качестве особенного и ни с чем не связанного раздела бытия, лишь проецируемого на физический мир, и другую - показывающую идеальное только лишь в статусе "субъективного". В первом случае онтология физического мира лишается самостоятельности, попадая в сильную зависимость от выбора моделей идеальных связей, прилагаемых к построению отношений физического мира, во втором - наши исходные посылки теряют собственную стабильность, позволяя обходиться с ними любым образом.
Модель, в которой идеальное рассматривается как субъективное, все же требует своего определения именно как способа неявного задания востребуемых семантической картиной природ, и поэтому все наши паритетные схемы взаимного участия Корреляции и причинности мы предпочтем строить как схемы, исходящие из принципа явного задания присутствующих природ.
Начнем же мы наш анализ проблемы взаимного проникновения Корреляции и причинности с рассмотрения наиболее простой модели сведения к общему основанию природы двух коррелирующих процессов. Положим, световые и звуковые волны распространяются потому, что существует материя, неотъемлемым свойством которой является присущая материальным элементам возможность взаимодействия. Тогда коррелятивными составляющими разных типов волновых процессов можно признавать признаки скорости перемещения фронтов волн, диаграммы направленности, но данное представление не допускает включение в него принципа, предполагающего для данных волновых процессов "Корреляцию в смысле отношения материального и идеального". В собственно же смысле принадлежности материальной природе данные процессы наделены общей причиной их протекания - а именно способностью материи воспроизводить материальные взаимодействия. Более того, имеют место и общие законы волновых процессов, распространяющиеся на тот и на другой тип волн, относительно которых тоже невозможно говорить о Корреляции звукового и светового сигнала.
Корреляция, отсюда, оказывается возможностью такой выделенной сопоставимости различных протеканий, когда относительно последних установлено, что они демонстрируют разную способность контакта с неким одним и тем же партнером по взаимодействию (в частности, в качестве такой общей базы может служить время). И тогда коррелятивная составляющая общей коррелятивно-причинной модели есть та ее часть, для которой не значимы никакие иные условия совмещения, кроме самого основания регуляризации. По обратной аналогии причинной составляющей общей коррелятивно-причинной модели будет та ее часть, для которой существенно наличие некого отдельного условия, выходящего за пределы общего основания регуляризации.
Чтобы сделать понятными сформулированные нами принципы нам следует обратиться к их иллюстрации примером преобладания причинной составляющей в некоей системе "параллельного действия". Достаточно адекватным примером здесь может послужить взрыв, сопровождающийся все же "отдельными" процессами распространения ударной, звуковой волны, вспышки и разлета осколков. Основой всех названных воздействий оказывается все же "причинна" - общий импульс, возникающий в силу резкого мгновенного повышения давления в некоем подрываемом заряде. Но и коррелятивная составляющая здесь все же присутствует - ведь получив свою долю энергии, каждый процесс развивается далее по свойственным ему законам.
Логика, если она собирается устанавливать причинно-следственные связи, нуждается в качестве необходимого основания для такого заключения в суждении о некоррелятивной природе приравниваемых оснований и последствий. Один критерий подобного рода проверки мы привели - необходимость вовлечения в такую связь большего числа условий связывания, чем просто одно условие регуляризации. Возможно, другим критерием, допускающим возможность определения некоторой связи именно как "причинной зависимости", может служить условие "полноты" определяющих некоторое сочетание оснований. Причинность, таким образом, возможна там, где некий набор оснований коррелирует именно таким "достаточным образом", что всякая иная корреляция оказывается для него именно внешней. Например, для кипения воды достаточно условий стабильности давления и наличия нагрева, а изменение напряженности слабых электромагнитных полей в этой зоне не влияет на данный процесс. В то же время колебания напряженности какого-либо радиоисточника может коррелировать с объемом подводимого к кипящей жидкости тепла.
В таком случае и логическая причинность обязательно требует рассмотрения ее как функции в отношении среды, обеспечивающей именно для данной Корреляции оснований причинности невмешательство иных расширяющих данную Корреляцию условий среды. В любом случае, как мы можем заключить здесь, причинность представляет собой порождение данных коррелятивных ограничений (свойств среды, обеспечивающих некоторой структуре Корреляции причинную достаточность).
Тогда корреляция, существующая таким "свободным" образом, что для нее невозможно расширение объёма комбинации, достаточного для образования причинно формирующей среды, требует рассмотрения как зачаточное условие некоей "ожидаемой" природы, в комбинации которой могла бы порождаться некая причинность. Если человек намыл желтого металла на глухом таёжном прииске, то корреляция этого желтого металла с возможным спросом на золото потенциально причинна для такой ранее отсутствовавшей природы как "обеспеченное существование" этого старателя.
В логическом смысле тогда нам следует рассматривать не Корреляцию или причинность в отдельности, а некий синтетический предмет эволюции условности (или - условий), стадиями которого являются коррелятивное или причинное преобладание. Существует, скорее всего, некая "сфера активности", демиургом которой являются те или иные "природы причинности", синтезируемые Корреляциями активностей, исходящих от неких "вторых" в отношении именно этой ситуации природ. Поскольку подобная "эволюционная цепочка" вряд ли допускает разрыв или конечное завершение, то всякую систему логических оснований следует строить на том, что выделять под нее комбинацию Корреляций, достаточных для образования новой "природы" в состоянии, пока они еще не образовали саму синтетическую общность такой "природы". В то же время не следует в порядке данной задачи рассматривать эти Корреляции как порожденные внешней причинно заданной активностью.
Скорее всего, нам следует рассмотреть простой пример подобного рода "суммы Корреляций". Например, известна такая сумма Корреляций как экономический норматив "выгодное географическое положение". Конечно, географическое положение является "выгодным" в том случае, если данную территорию пересекают некие торговые пути. Торговые пути возникают в том случае, если, скажем, место сырьевого вывоза находится по одну сторону данного района, а место вывоза готового товара - по другую, и альтернативного прохождения данного пути не предвидится. Но, скажем, та же самая территория может соседствовать с местом товарного вывоза, а по другую сторону ее границы - будут проживать лишь племена, занятые примитивным собирательством.
Тогда положение, когда данный район уже соседствует с некоей экономической зоной, но торговый обмен через него вследствие отсутствия каких-либо иных торговых зон еще не производится, можно обозначать как определенную нами ситуацию свободной Корреляции. Такой же ситуацией свободной Корреляции будет первый момент весеннего пробуждения, когда уже сошел снег, солнце шпарит, а почва еще не набрала достаточного количества тепла. Следовательно, коррелятивная ситуация - это ситуация по существу неравновесного положения вещей, когда его дополнение еще одним коррелирующим условием может сместить положение в ту или иную сторону.
Подобное положение позволяет говорить о возможности, о той самой, о которой мы говорили вначале, синтетической причинно-коррелятивной общности. Если ситуация позволяет фиксировать ее как определенно причинную или, напротив, простую парную Корреляцию, то имеет место одно положение вещей. А если же множество коррелирующих условий выходит за размеры пары, то о таком положении вещей мы можем говорить либо как о недостроенной причинности, либо как о некоей "исходной коррелирующей паре", находящейся в положении подбора любого сочетающегося с ней стороннего коррелирующего отношения. В любом случае любое положение допускает его представление и в статусе Корреляции, и в статусе реальных или потенциальных причины или следствия, а ставящийся при построении модели акцент на причинность или на Корреляцию означает всего лишь сделанную составителем модели оценку существующего преобладания.
Чем в таком случае может оказаться наше понимание, определяющее факт преобладания в данном сочетании связей или же причинной или коррелирующей зависимости? Мы здесь не будем рассматривать наше отношение в статусе товара проявления нашей же субъективности, а представим себе, что причиной данного нами определения являлась непосредственно телеология нашего поступка. То есть если наша интенциональность направлена на отдельное взаимодействие с каждой коррелирующей условностью, то отсюда появляется одна возможность нашей оценки, если, напротив, именно с совместностью всех коррелирующих условностей - то другая. Если говорить о примере, то здесь можно говорить о различии взглядов на автомобиль механика и водителя; механик обращает свой взгляд на согласованность элементов конструкции, водитель - на автомобиль в целом.
Фактически же не требует особого объяснения идея того, что модель Корреляции - это представление, обслуживающее потребности диссоциирующего моделирования структурированных систем, модель причинности - представление, описывающее т.н. "эмержентные свойства" структурированных систем. Корреляция - это, по существу, логическое средство компонентного разбора некоей существенности, служащее цели точного и тонкого выделения структурного элемента в т.н. "чистую линию". Превосходный пример здесь - физика полупроводников, где тип проводимости определяется практически незаметной долей примести. Установление данного условия может осуществляться именно посредством последовательного выделения отдельных коррелирующих в механизме полупроводниковой проводимости сущностей, как можно более тонкого разбиения влияний по условиям их природы.
Причинность - это исследование возможности действия в его определенности и полноте. Если мы высаживаем огород и далее его не обрабатываем, то, тем не менее, располагаем шансом получения некоего минимального урожая, особенно неприхотливых культур. Просто факт всхода наших посевов говорит о том, что причина получения какого-то урожая - уже налицо. Но получение полноценного урожая возможно лишь при должном уходе за посадками, но и не только уходе, но и подкормке, помощи в опылении и т.д. Следовательно, анализ причинности представляет собой анализ множества достаточных конфигураций в аспекте их причинной достаточности.
Анализ причинности отличается от анализа Корреляции тем, что он всегда исследует не одно и то же положение, но, фактически, - именно ряд конкурирующих положений. В анализе Корреляции исследуется одно положение, но оно берется в различных детализирующих представлениях, но как такое именно избранное исходное положение оно задано раз и навсегда. Мы получили фактический критерий различия корреляционного и причинного анализа: по отношению к исходному положению корреляционный анализ занят лишь углублением условий этого единственного положения, причинный анализ - исследованием конкурентности этого положения в ряду подобных положений. Для причинного анализа детерминирующим условием его единственности является уникальность результата.
Но то, что мы в результате выяснили - это положение, что и логику невозможно рассматривать вне некоей "телеологической" проекции. Логика представляет собой, в виду ее распадения на корреляционный и причинный анализ, обыкновенную практику, реализующую изначальную установку в конфигурации условий задачи - либо она вводит законы выведения истинности состава неизменного содержания (корреляция), либо - законы допустимости относительной неполноты истинностных посылок для причинного порождения.
Выраженное выше наше понимание логики не совпадает с традиционным пониманием предмета этой науки, как она представлялась в качестве науки "решения одной задачи" - установления истинности. На наш взгляд, логика представляет собой науку об общих правилах соотнесения при решении совершенно разных задач - задачи обратного выведения (корреляция), конкурентного выведения (причинность) и третьей, не рассматриваемой нами здесь, но весьма важной для идеальных соотнесений, задачи прямого построения (чистой компарации).
В таком случае логике необходим особый механизм исследования условий решаемых ею задач. Поскольку в семантике условия можно задать только по отношению к тому, что является отражающей данные условия основой, то в таком случае логический анализ условий логической задачи представляет собой анализ присущей такой задаче рациональности. Последняя же может быть определена только в отношении востребующего подобное соотнесение "приобретателя"; то есть анализ условий логической задачи является анализом востребований операндного пространства, по отношению к которому такая задача ставится. Фактически, анализ условий логической задачи превращается в семантический анализ условий зависимости по отношению некоей природы, что говорит уже о его логико-семантическом характере.
Итогом нашего исследования взаимозависимости Корреляции и причинности следует признать не только практический вывод о характере тех или иных задач, но и вывод о позиции логики по отношению познавательного процесса в целом. Формальная логика, ограниченная задачей "чистой компарации", справедлива в узких пределах заведомо строго определенных условностей и, при этом, только в таком случае, когда предметом исследования оказываются не порождающие, типа причинности или Корреляции, а только сопоставительные зависимости. Как только мы переходим к логическому анализу "расширяющей" связи, образцом которой можно назвать ту же самую причинную зависимость, мы обращаем логическую задачу лицом к условиям внешнего мира, через семантическое влияние определяющих уже саму возможность логического решения. Фактически анализом подобного рода сопутствующих вынесению решения условий и занята существующая сейчас наука "формальная логика".
Парная корреляция
Часто при проведении маркетингового исследования нас интересует связь между двумя метрическими переменными, как, например, в следующих ситуациях.
Насколько сильно связан объем продаж с затратами на рекламу?
Существует ли связь между долей рынка фирмы и численностью ее торгового персонала?
Связано ли восприятие качества товаров потребителями с их восприятием цены?
В таких ситуациях наиболее широко используемой статистикой является коэффициент парной Корреляции, (commercial units moment Correlation r), который характеризует степень тесноты связи между двумя метрическими (измеряемыми с помощью интервальной или относительной шкал) переменными, скажем, Х и Y. Этот коэффициент используют, чтобы определить, существует ли между переменными линейная зависимость. Он показывает степень, в которой вариация одной переменной X связана с вариацией другой переменной Y, т.е. меру зависимости между переменными Х и Y.
Коэффициент парной Корреляции, г (commercial units moment Correlation r)
Статистический показатель, характеризующий степень тесноты связи между двумя метрическими переменными.
Поскольку этот коэффициент первоначально предложил Карл Пирсон, его также называют коэффициентом Корреляции Пирсона. Кроме того, он известен как простой коэффициент Корреляции, линейный коэффициент Корреляции или просто коэффициент Корреляции.
В этих уравнениях X и Y обозначают выборочные средние, а — соответствующие стандартные отклонения; COV представляет собой ковариацию (covari-апсе) между Х и Y, т.е. меру зависимости Xи Y.
Ковариация может быть как положительной, так и отрицательной. Деление на SxS приводит к нормированному виду, так что коэффициент Корреляции г находится в пределах от -1 до +1. Обратите внимание, что коэффициент Корреляции никак не связан с единицами измерения, в которых выражены переменные.
Предположим, что исследователь хочет выяснить, зависит ли отношение респондента к местожительству от длительности его проживания в этом городе. Отношение выражают в 11- балльной шкале (1 — не нравится город, 11 — очень нравится город), а продолжительность проживания измеряют количеством лет, которые респондент прожил в этом городе.
В этом примере г = 0,9361, что близко к 1. Это означает, что отношение респондента к своему городу сильно зависит от времени проживания в нем. Более того, положительный знак г указывает на прямую связь (прямо пропорциональную): чем дольше респондент проживает в городе, тем больше он ему нравится, и наоборот.
Поскольку коэффициент Корреляции показывает меру, в которой вариация значений одной переменной зависит от вариации другой, можно выразить через разложение полной вариации.
Следовательно, г2 показывает, какая доля вариации одной переменной обусловлена вариацией другой. И г, и г2 являются симметричными показателями связи между переменными. Иначе говоря, корреляция между Х и Y та же, что и корреляция между Y и X. Корреляция не зависит от того, какая из переменных взята в качестве зависимой, а какая — в качестве независимой. Коэффициент Корреляции является мерой линейной зависимости, и он не предназначен для измерения силы связи в случае нелинейной зависимости. Таким образом, г = 0 просто означает отсутствие линейной зависимости между Х и Y. Это не означает, что Х и Y не взаимосвязаны. Между ними может существовать нелинейная зависимость, которую нельзя определить с помощью коэффициента Корреляции г.
Если коэффициент Корреляции вычисляют не для выборки, а для всей генеральной совокупности, то он обозначается греческой буквой р (ро). Коэффициент г — это оценка р. Обратите внимание, что расчет г предполагает, что X и Y- метрические переменные, кривые распределения которых имеют одинаковую форму. Если эти допущения не удовлетворяются, то значение г уменьшается и р получается недооцененным. В маркетинговых исследованиях данные, полученные с использованием относительной шкалы при небольшом количестве категорий, могут не быть строго интервальными.
Статистику, лежащую в основе критерия для проверки гипотезы, вычисляют по формуле которая имеет распределение с (п — 2) степенями свободы. Для коэффициента Корреляции, вычисленного на основе данных, а число степеней свободы- 12- 2 = 10. Следовательно, нулевую гипотезу об отсутствии связи между переменными Х и Y отклоняют. Это, наряду с положительным знаком коэффициента Корреляции, показывает, что отношение респондента к своему городу прямо пропорционально зависит от продолжительности проживания в нем. Более того, высокое значение г свидетельствует о том, что эта связь сильная.
При выполнении многомерного анализа данных часто полезно изучить простую Корреляцию между каждой парой переменных. Эти результаты представляют в форме корреляционной матрицы, которая показывает коэффициент Корреляции между каждой парой данных. Обычно рассматривают только самую нижнюю треугольную часть матрицы. Все элементы по диагонали равны 1,00, так как переменная коррелирует сама с собой. Верхняя треугольная часть матрицы — зеркальное отражение нижней треугольной части матрицы, поскольку г — симметричный показатель связи между переменными.
Хотя матрица простых коэффициентов Корреляций позволяет уяснить суть по парных связей, иногда исследователю хочется изучить связи между двумя переменными при условии управления одной или несколькими переменными. В последнем случае следует оценивать частную Корреляцию. В последние годы понятие и применение in vitro — in vivo Корреляции (IVIVC) для фармацевтических дозированных лекарственных форм стали одними из центральных предметов рассмотрения фармацевтической промышленностью, ВУЗами и регулирующими организациями. Поскольку разработка и оптимизация технологических составов (прописей) — неотъемлемая часть производства и анализа рынка любого терапевтического средства, они являются наиболее трудоемкими и дорогостоящими. В процессе оптимизации могут потребоваться изменения технологической части, производства, оборудования или масштабов производства. Если таковые типы изменений применены к технологической прописи, то исследования на здоровых добровольцах необходимо повторять для подтверждения того, что новая пропись биоэквивалентна старой. Безусловно, выполнение этих требований не только тормозит анализ конъюнктуры рынка новой технологической прописи, но также и увеличивает цена ее оптимизации. Таким образом, на сегодняшний день для производителей предпочтительнее и экономически выгоднее разрабатывать тесты in vitro, которые будут адекватно отражать исследования биодоступности.
Регуляторные руководства для дозированных форм как немедленного, так и модифицированного высвобождения, были разработаны FDA. Актуальность их создания заключалась, во-первых, в уменьшении необходимости проведения исследований биодоступности, а вовторых, они требовались для замены устаревших методов разработки и оптимизации технологических прописей.
Как указывалось выше, разработка IVIVC главным образом нацелена на то, чтобы частично или полностью заменить испытания на здоровых добровольцах в течение всего периода создания препарата. В дополнение к этому, IVIVC также можно использовать для изучения IVIVC спецификаций и для валидации методик растворения. Такое применение данного метода заключено в его определении. Данный метод также может стать серьезным подспорьем в процессе контроля качества в случае масштабирования производства (например, для улучшения состава технологической прописи или внесения изменений в производственный процесс) и / или внесения пострегистрационных изменений. При этом следует учитывать, что данные in vitro будут гарантироваться тем, что каждая политическая партия одного и того же препарата будет действовать идентично in vivo.
С быстрым увеличением препаратов с модифицированным высвобождением, существенно повысилась и значимость более глубокого изучения IVIVC. Хотя акцент дискуссии в этом обзоре будет, прежде всего, сосредоточен на технологических формах с модифицированным высвобождением, для которых считается, что IVIVC лучше прогнозируется, также будут рассмотрены некоторые аспекты ее применения и для технологических форм с немедленным высвобождением.
Определение понятий
Термин «корреляция» часто используется как в фармацевтических, так и смежных науках для того, чтобы описать взаимосвязь, которая существует между переменными. С точки зрения математической статистики, корреляция — это вероятностная или статистическая зависимость, не имеющая, вообще говоря, строго функционального характера. В отличие от функциональной, корреляционная зависимость возникает тогда, когда один из признаков зависит не только от данного второго, но и от ряда случайных факторов или же когда среди условий, от которых зависят и тот, и другой признаки, имеются общие для них обоих условия. С биофармацевтической точки зрения, Корреляцию можно представить как взаимосвязь между соответствующими in vitro характеристиками и in vivo параметрами био-доступности. Для описания IVIVC USP и FDA были предложены следующие определения:
USP IVIVC — это установление рациональной взаимосвязи между биологическими свойствами, или производными параметрами биологических эффектов, вызываемых лекарственным препаратом и физико-химическими свойствами или характеристиками этого же препарата.
FDA IVIVC — это прогнозирующая математическая модель, описывающая взаимосвязь между in vitro свойствами дозированной лекарственной формы и релевантным ответом in vivo.
В целом, in vitro свойство — это степень растворения или высвобождения, в то время как in vivo отклик — это концентрация препарата в плазме или количество абсорбированного препарата.
Степени Корреляции
Руководства FDA выделяют 5 уровней IVIVC. Несмотря на это, на наш взгляд, а также с точки зрения математики, более корректным будет обозначить не «уровни», а «степени» Корреляции, поэтому далее будет употребляться именно термин «степень Корреляции».
Понятие «степень Корреляции» основано на ее способности отражать профиль зависимости концентрации активной фармацевтической субстанции (API) в плазме крови от времени. Профиль, в свою очередь, является результатом приема дозированной лекарственной формы.
Степень Корреляции А
Эта степень является самой высокой категорией Корреляции и представляет собой взаимосвязь вида точка-к-точке между in vitro скоростью растворения и in vivo скоростью высвобождения API из дозированного лекарственного средства. Как правило, процент поглощенного препарата может быть вычислен техникой модельных зависимостей, таких как метод Вагнер-Нельсона, Лу-Ригельмана или модель-независимой численной деконволюцией.
Степень Корреляции В
Степень Корреляции B использует принципы моментного статистического анализа. В этой степени Корреляции среднее время растворения in vitro (MDTvitro) препарата сравнивается со средним временем удержания in vivo (MRT) или средним временем растворения in vivo (MDTvivo). И хотя степень B использует весь набор данных in vitro и in vivo, она не является Корреляцией вида точка-к-точке и не отражает фактические кривые плазменных концентраций in vivo.
Степень Корреляции С
В этой степени Корреляции одна точка времени растворения (Т50 %, Т90 %, и т. д.) сравнивается со средним одного из фармакокинетических параметров, типа AUC, Тmax или Cmax.
Многоуровневая степень Корреляции C
В этой степени Корреляции рассчитывают отношение одного или нескольких интересующих фармакокинетических параметров (Cmax, AUC или любые другие подходящие параметры) к содержанию растворенного препарата в нескольких точках времени профиля растворения.
Степень Корреляции D
Этот тип Корреляции считается неформальным, однако он может играть вспомогательную роль в разработке технологической прописи или метода обработки данных.
Систематическая разработка Корреляции
Для разработки IVIVC можно использовать любой хорошо спланированный и научно-обоснованный подход. Поскольку создание IVIVC — динамический процесс, он начинается с наиболее ранних стадий разработки препарата, вплоть до заключительного этапа. Чтобы понять, как широко используется in vitro-in vivo соотношение (IVIVR) в цикле создания препарата, полезно ознакомиться со следующими терминами, поскольку они непосредственно касаются типичного процесса разработки пероральных форм.
Предполагаемая IVIVR — по существу представляет собой соотношение, которое дает первоначальный толчок на первой стадии создания препарата. В течении стадии 1 соответствие данных in vitro желаемому профилю in vivo позволяет сформировать точное представление о препарате и создать спецификации. Такая модель может, естественно, пересматриваться, поскольку используется как прототип создаваемой прописи. Этот цикл далее постепенно переходит из этапа in vivo на этап in vitro испытаний. Данный переход также именуется ретроспективная IVIVR. Когда состав технологической прописи определен по соответствующим in vivo спецификациям, начинается стадия 2. Данная стадия основывается на понимании и оценке установленного состава прописи и ее особенностей. После установления IVIVR ее можно использовать для заключительного цикла создания и оптимизации процесса разработки препарата. Таким образом, стадия 2 постепенно переходит в стадию 3, которая характеризуется плавным масштабированием производства, валидацией методик и завершающим этапом регистрации с постодобрением или внесением регистрационных изменений. То есть в данном случае IVIVR рассматривается_не как единственно осуществимый, а как интегративный метод разработки, который параллельно используется со всеми стадиями процесса и в конечном итоге позволяет создать прогнозируемую IVIVС.
Важные моменты в разработке степени Корреляции А
Когда на процесс растворения не влияют такие факторы как pH, поверхностно-активные вещества (сурфактанты), осмотическое давление, интенсивность перемешивания, ферменты, ионная сила, то набор данных по растворению, полученный по одной и той же прописи коррелирует с набором данных деконволюции плазменной концентрации. Для демонстрации Корреляции строят график, на котором показывают отношение фракции, поглощенной in vivo к фракции, высвобожденной in vitro. Если наблюдается линейная зависимость с угловым коэффициентом равным 1, то кривые характеризуются как суперпозиционные, т. е. их отношение 1:1 и следовательно присутствует взаимосвязь вида точка-к-точке или корреляция степени А. В таких условиях корреляция считается общей и может быть экстраполирована в пределах приемлемого диапазона для данной технологической прописи. Методология in vitro растворения должна адекватно дифференцировать исследования препаратов. Таким образом, когда подобрана подходящая система и условия, их необходимо протестировать для всех прописей путем биоисследований, целью которых является последующая разработка Корреляции. В начальных стадиях условия растворения могут быть изменены для того, чтобы попробовать создать взаимно однозначную Корреляцию между профилями in vitro и in vivo.
Установление Корреляции действительно только для определенного типа дозированных лекарственных форм (таблетки, желатиновые капсулы и т. д.) со специфическим механизмом высвобождения (матрица, осмотическая система, и т. п.) и специфическими вспомогательными веществами. Корреляция является верной и прогнозируется, только если модификации этой дозированной формы остаются в пределах определенных лимитов, совместимых с механизмом высвобождения и вспомогательными веществам. Также должна быть принята во внимание экстраполяция IVIVC, установленная на здоровых пациентах и тот факт, что препараты часто принимаются до, во время или после еды. Все эти факторы могут сильно увеличить вариабельность результатов. Посткорреляция может быть установлена только в случае использования данных о пациентах, а также увеличения изученных характеристик препарата.
Что касается скорости высвобождения, то она измеряется в процентах растворения, и для каждой изученной технологической прописи должна адекватно отличаться. Это результат in vivo профилей, которые показывают сопоставимую маржу, например, 10 % маржа интересующих фармакокинетических параметров (Cmax или AUC) между каждой технологической прописью.
Биофармацевтическая система классификации (BCS)
Биофармацевтическая система классификации (BCS) представляет собой инструмент для разработки, который дает возможность оценить вклад трех фундаментальных факторов: растворение, растворимость и кишечную проницаемость, которые управляют скоростью и степенью поглощения субстанции из твердой дозированной пероральной лекарственной формы. Растворение препарата представляет собой процесс высвобождения действующего вещества, в результате которого это вещество становится доступным к всасыванию. Проницаемость же, в свою очередь, относится к способности молекулы субстанции проникать через мембрану в системный кровоток. БСК является также фундаментальным руководством для определения условий, при которых ожидается IVIVC и для разработки спецификаций in vitro растворения. БСК оперирует моделями растворения и абсорбции препарата, которые рассматриваются по ключевым параметрам, управляющим растворением препарата и его всасыванием, таким как: число всасывания, число растворимости и единица дозы .
Число всасывания (An) — это отношение среднего времени удержания (Tres) к среднему времени абсорбции (Tabs).
Число растворимости (Dn) — это отношение Tres к среднему времени растворения (Tdiss).
Единица дозы (D0) — это отношение дозы к растворимости лекарственного средства.
Классификация БСК в сочетании с многочисленными фармакопейными и физиологическими средами растворения может использоваться как фундаментальное руководство для проектирования и создания соответствующих биорелевантных условий растворения, ведущих к более многозначительному прогнозированию in vivo действия.
Учитывая потенциал, заложенный в БСК, можно утверждать, что корректно разработанный тест на растворение может быть ключевым прогнозирующим инструментом в оценке как возможности использования препаратов для орального приема, так и проведения биоэквивалентности их технологических прописей. Основная цель использования мер связи в экспериментальном исследовании – проверка статистической нуль-гипотезы о том, что переменные ХиY не связаны, т.е. имеют нулевой коэффициент Корреляции в совокупности [15, с. 287]. В логике экспериментального вывода соответствующие статистические решения занимают вполне определенное место: от количественной оценки значимости выявленной ковариации переменных зависит содержательный вывод об обоснованности экспериментальной или контргипотезы (или необходимости поиска других конкурирующих гипотез). Если в соответствии с полученными эмпирическими данными нуль-гипотеза не может быть отвергнута, то следует отвергнуть экспериментальную гипотезу, т.е. признать изменения переменных не связанными друг с другом. В этой логике отвержения экспериментальных гипотез коэффициент Корреляции выполняет ту же роль, что и меры различий: /-критерий Стьюдента и др. Более строго следовало бы говорить об отвержении гипотезы о значимости коэффициента Корреляции.
Обычно в учебных пособиях по статистике специально выделяется случай доказательства того, что коэффициент Корреляции для двух выборок равен нулю. Роль этого частного случая заключается в том, что при отсутствии ковариации не выполняется существенное условие причинного вывода. Однако реально цель доказать, что связь между переменными равна именно нулю, а не просто является незначимой, ставится чрезвычайно редко. Научное познание направлено на выявление не того, что что-то от чего-то не зависит, а на установление закономерных зависимостей одних переменных от других (при проверке содержательных гипотез).
Специальный случай доказательства равенства коэффициента Корреляции нулю важен в основном при желании исследователя обосновать конкурирующую гипотезу о зависимости измеряемого показателя от какого-то другого (третьего) фактора. Следует при этом помнить, что проверка статистической гипотезы о равенстве коэффициента связи нулю не тождественна проверке гипотезы о не значимости связи между переменными. В первом случае речь идет о точке на числовой оси, а точечное оценивание требует иных (больших) издержек, чем интервальное оценивание.
При корреляционном подходе, не предполагающем управление независимыми переменными, равноправными с точки зрения логики последующего содержательного вывода являются статистические решения о равенстве коэффициента Корреляции какому-то числу, одинаковой Корреляции переменной X с другими переменными (Y и Z), значимости множественной Корреляции. Традиционный подсчет коэффициента Корреляции предполагает указание уровня значимости при определенном количестве наблюдений, т.е. числа измерений. Не сама по себе подсчитанная на основе эмпирических данных величина коэффициента Корреляции служит основанием для оценки приемлемости психологической гипотезы о связи между переменными, а статистическое решение о том, следует ли считать вычисленное значение коэффициента Корреляции значимым. Иными словами, установление факта незначимости Корреляции между переменными служит основанием для принятия решения отвергнуть гипотезу о связи между переменными. Интерпретация установленной связи полностью подчинена не следующему из самого эмпирического материала обоснованию ее направленности или опосредования ее тем или иным базисным процессом.
Это же ограничение касается и многомерного анализа данных, в частности множественно-регрессионного анализа. Так, нуль-гипотеза при таком анализе утверждает, что нет связи между предсказываемой переменной и данным набором предсказывающих переменных. Если нуль-гипотеза, согласно полученным результатам, не может быть отвергнута, то это означает, что предсказываемая переменная не имеет значимых связей ни с одной из переменных набора. Если принятие содержательной гипотезы исследования предполагает отвержение нуль-гипотезы как отсутствия линейных количественных связей между двумя наборами переменных, то установление этой линейной комбинации по полученным данным все же может оказаться недостаточным для подтверждения исходных априорных положений. Как подчеркивается в современных обзорах основных направлений многомерного анализа данных, самая существенная трудность состоит в том, что в случае отвержения общей нуль-гипотезы «позитивные» результаты могут не поддаваться разумной интерпретации. Рассматривается геологическая модель площади, включающей многие десятки или даже сотни скважин. Решается задача уточнения этой геологической модели за счет выполнения более качественной Корреляции скважин по данным ГИС.
Реализован следующий подход – точная и геологически обоснованная корреляция скважин выполняется вручную, но внутри автоматически созданной трехмерной визуальной среды.
Визуальная среда рассчитывается посредством интерполяции скважинных данных вдоль формальных квазистратиграфических поверхностей, которые дает автоматическая корреляция интервалов скважин по данным ГИС.
Постановка задачи автоматической Корреляции
По точкам с координатами скважин на плоскости X,Y (или на поверхности некоторого горизонта) рассчитывается триангуляционная сеть. Отрезки триангуляционной сети определяют пары скважин. Коррелируются вертикальные интервалы пар скважин, имеющие протяженность 60-100 м и соответствующие друг другу по глубине.
Сопоставляя интервалы двух скважин, мы не знаем, какие стратиграфические горизонты присутствуют в обоих интервалах, а какие в одном размыты. Соответственно, мы не знаем, когда видимое сходство участков каротажных кривых направляет трассирование стратиграфической поверхности в правильном, а когда - в ошибочном направлении. Для одной пары интервалов эта неопределенность не может быть разрешена никакими формальными средствами. Выход состоит в следующем: в каждой паре интервалов мы будем фиксировать все возможные варианты (направления) Корреляции, определяя для каждого варианта его количественную оценку (вес).
Выбор же одного, нужного нам “правильного” варианта в каждой паре будем производить, используя всю совокупность пар и опираясь на два критерия: все “правильные” варианты в парах должны быть согласованы на триангуляционной сети, они должны иметь максимальный суммарный вес.
Удовлетворяющий данным требованиям набор вариантов Корреляции интервалов будет нашим решением. С его помощью можно будет построить одну квазистратиграфическую поверхность, ассоциированную примерно с центрами интервалов и идущую параллельно самому выразительному в них ненарушенному стратиграфическому горизонту. Повторив расчет Корреляции для чуть более глубоких интервалов, можно будет получить квазистратиграфическую поверхность на 30-50 м ниже предыдущей, и т.д. Стопка из таких формальных поверхностей позволит нам рассчитать упомянутую выше трехмерную визуальную среду.
Перед выделением корреляционных предположений каротажные кривые приводятся к виду, допускающему их формальное сравнение. А именно, кривые ПС преобразуются в кривые альфа-ПС, кривые БК (с острыми пиками) логарифмируются, все кривые (кроме альфа-ПС) нормируются на среднее в интервале. При расчете Корреляции интервалов скважин учитываются вклады, даваемые Корреляцией кривых разных методов ГИС.
Корреляция интервалов одноименных каротажных кривых Формальное сравнение интервалов одноименных кривых производится посредством их наложения с переменным сдвигом по вертикали.
Корреляция кривых при каждом наложении рассчитывается как обратное значение их разности.
При нулевой разности корреляция равна 100.
При разности (max-min) * N корреляция равна 0.
max, min – минимум и максимум значений кривых в двух интервалах,
N – число сопоставляемых дискретных значений.
Наложение каротажных кривых и оценка степени Корреляции Важное дополнение – корреляция кривых рассчитывается раздельно для малых фрагментов интервалов (выделено цветом), и далее учитываются вклады только тех фрагментов, корреляция в пределах которых выше заданного порога.
В противном случае большое различие кривых вследствие размыва отдельных участков интервалов скрывает высокую степень Корреляции ненарушенных горизонтов.
Вид функции Корреляции и выделение корреляционных предложений Вид функции Корреляции интервалов кривых показан слева. Ее аргументом является величина смещения интервалов друг относительно друга. Функция Корреляции интервалов определяется как сумма функций Корреляции кривых разных методов ГИС.
При выделении альтернативных корреляционных предположений задается разрешение δ.
Первое корреляционное предположение (это есть величина сдвига) соответствует максимуму функции Корреляции. Вес этого предположения равен значению максимума функции Корреляции. Затем в функции Корреляции делается “вырез” треугольником с шириной основания 2δ и берется следующий максимум, и т.д. Число выделяемых предположений зависит от величины δ и диапазона смещения интервалов. Исходя из разумной достаточности, будем выделять в каждой паре скважин 20 корреляционных предположений.
2. Конструирование цепочек предположений вдоль сторон треугольников
Предположения в отношении Корреляции интервалов можно представить в виде “стрелок” так, как это сделано на рисунке.
Каждая “стрелка” характеризует сдвиг интервалов (поэтому ее можно смещать параллельно самой себе) и имеет вес, равный соответствующему значению функции Корреляции. Минимальное различие между соседними “стрелками” определяет параметр δ.
В каждом треугольнике триангуляционной сети составляются все возможные цепочки предположений, замыкающиеся с погрешностью меньшей, чем δ/2. Максимальная погрешность δ/2 гарантирует, что пару предположений по двум сторонам треугольника замыкает не более чем одно предположение по третьей стороне. Если в каждой паре у нас 20 предположений, то максимальное число замкнутых цепочек в треугольнике равно 400. Предположения, не вошедшие ни в одну из цепочек, удаляются. Тем самым мы начинаем процесс исключения ошибочных альтернатив.
Очевидно, что “правильные” корреляционные предположения при обходе сторон треугольника должны составить замкнутую цепочку цепочка НЕ принимается
3. Конструирование локальных гипотез вокруг узлов триангуляционной сети
Следующий этап – из цепочек в треугольниках составляются локальные корреляционные гипотезы вокруг узлов триангуляционной сети.
Фрагмент триангуляционной сети вокруг одного внутреннего узла показан на следующем рисунке. Цепочки предположений в смежных треугольниках (например, AOB и BOC) будем называть согласованными, если по общей стороне (OB) в этих цепочках стоит одно и то же предположение.
Локальной гипотезой будем называть набор цепочек, согласованных во всех треугольниках вокруг одного узла триангуляционной сети. Общее число локальных гипотез вокруг одного узла огромно – верхняя оценка дает 20 в степени N, где N – число треугольников (на рисунке N равно 6).
Это указывает на гибкость модели, основанной на предположениях.
Из всех гипотез нам нужна только одна самая весомая и мы можем ее получить следующим путем:
Объединим цепочки в треугольниках AOB и BOC.
При этом число согласованных вариантов Корреляции (по верхней оценке) возрастет в 20 раз – от 400 в одном треугольнике до 8000 в двух.
Однако для каждой пары предположений вдоль AO и OC мы можем оставить только один вариант, имеющий максимальный вес.
В результате число вариантов уменьшается опять до 400.
Затем мы добавляем следующий треугольник и все повторяем.
Так мы находим локальную гипотезу, согласованную и имеющую максимальный вес.
Локальные гипотезы рассчитываются вокруг каждого узла триангуляционной сети.
Предположения, не вошедшие ни в одну локальную гипотезу, удаляются.
Тем самым мы исключаем основную массу исходных корреляционных альтернатив (но еще не все).
4. Согласование локальных корреляционных гипотез на всей триангуляционной сети
На каждом треугольнике триангуляционной сети перекрываются три локальные гипотезы, рассчитанные вокруг его вершин.
Поскольку эти гипотезы конструируются независимо, они могут не совпадать.
Несовпадение локальных гипотез будем считать признаком того, что как минимум одна из них неверна, а совпадение, наоборот, будет достаточным указанием на то, что все три истинны.
Рассмотрим фрагмент триангуляционной сети на рисунке. Выделим красным цветом треугольники, на которых предположения из перекрывающихся цепочек различаются больше, чем на 2δ.
Допустим, это треугольники ABC и BCD.
Рассмотрим сначала треугольник ABC.
Поставим вопрос так: какая локальная гипотеза (вокруг A, B или C) содержит ошибку?
Критерий выделения ошибки такой: локальная гипотеза не может содержать ошибку только в одном треугольнике. Действительно, поскольку все треугольные цепочки в ней согласованы, ошибочных треугольников не может быть менее двух. Следовательно, гипотеза A (вокруг узла A) правильная, исправлять надо гипотезы В и C. Их исправление производится за два шага:
цепочки в B и C по треугольнику ABC исправляются по образцу соответствующей цепочки из A.
цепочки в B и C по треугольнику BCD исправляются таким образом, чтобы восстановить нарушенную первым исправлением локальную целостность гипотез B и C.
Обязательное условие исправления – расхождение цепочек на смежном треугольнике BCD не должно возрасти. В данном случае дефект согласования на треугольнике BCD не только не возрастет, но также будет устранен.
Описанным выше путем можно устранить 99% дефектов согласования, кроме одного особого случая. Это дефект согласования “второго рода”, показанный на рисунке. Суть этого дефекта в том, что ошибочные цепочки по треугольнику BCD совпадают во всех трех гипотезах B, C и D. При таком совпадении ошибка по треугольнику BCD не идентифицируется (идентифицируются только сопутствующие ошибки в соседних треугольниках) и исправить ее обычным путем невозможно. Для устранения дефектов второго рода разработана особая процедура – дефект локализуется в пределах гипотезы B, фиксируется контур вокруг гипотезы B, гипотеза B пересчитывается при фиксированном внешнем контуре, после чего получается несколько иная конфигурация (показанная на том же рисунке внизу), которая исправляется обычным путем. Количество заметных (больших 2δ) дефектов второго рода очень мало.
Но по мере того, как точность согласования локальных гипотез приближается к нулю, этот механизм согласования начинает использоваться чаще. Дефекты второго рода появляются тогда, когда роль наиболее выразительного горизонта в пределах интервала Корреляции переходит от одного горизонта к другому.
После увязки локальных гипотез мы получаем набор корреляционных предположений (направлений Корреляции), согласованных на всей триангуляционной сети. Поскольку все эти предположения можно смещать (в пределах коррелируемых интервалов) параллельно самим себе, они определяют квазистратиграфическую поверхность с точностью до произвольной добавки по глубине Z. Для определенности берется поверхность, имеющая минимальное отклонение от центров коррелируемых интервалов.
Реальные примеры
Автоматическая процедура позволяет легко проверить любую ранее выполненную ручную Корреляцию скважин. Для этого достаточно разместить на отметках ручного репера центры коррелируемых интервалов. Результатом будут несколько иные отметки, определяющие квазистратиграфическую поверхность и выражающие объективную Корреляцию интервалов заданной ширины.
Сравнение результатов ручной (красные отметки) и автоматической (черные отметки) Корреляции. Дано два варианта выравнивания скважин. Каротажные кривые показывают значения альфа-ПС. Ширина интервалов автоматической Корреляции равнялась 60 м, при ее расчете учитывались данные пяти методов ГИС (альфа-ПС, ГК, НКТ, ИК, БК).
Представление о том, как соотносятся результаты ручной и автоматической Корреляции, дает профиль на приведенном выше рисунке. Для большей наглядности показано два варианта выравнивания скважин - вверху по ручному реперу, внизу по автоматическому. Тщательный анализ случаев расхождения отметок (везде, не только на этом профиле) приводит к выводу, что автоматическая корреляция всегда точнее ручной. Причина этого в том, что геолог не в состоянии различить на каротажных кривых случайные и регулярные черты геологической среды. Стараясь быть точным, он идет на поводу у случайных особенностей. Стратиграфические границы, трассируемые автоматически, получаются более гладкими (друг относительно друга), чем трассируемые вручную.
Нижестоящий рисунок является иллюстрацией применения автоматической Корреляции на площади в Западной Сибири, включающей 1500 скважин. Показано два сечения трехмерного образа геологической среды, полученного в результате интерполяции значений альфа-ПС (синие кривые) от скважин вдоль формальных корреляционных границ. Исследование образа среды производится средствами динамической визуализации в условиях палеореконструкции по тем же формальным границам. Хорошо просматривается палеорусло. Отметки на скважинах показывают результаты традиционной ручной Корреляции. Можно видеть, что при трассировании горизонта белыми отметками допущены серьезные ошибки.
Два сечения трехмерного "образа", рассчитанного на основе автоматической Корреляции.
На следующем рисунке показан другой аналогичный пример, на этот раз относительно площади (также в Западной Сибири), включающей около 700 скважин. Полученный образ (показано одно горизонтальное и два вертикальных его сечения в условиях палеореконструкции по формальным границам) помогает идентифицировать обстановку осадконакопления. Кроме того, здесь тоже очевидны некоторые ошибки ручной Корреляции (белые отметки).
Последняя иллюстрация касается одного из самых объемных примеров. Автоматическая корреляция была выполнена на площади, включающей свыше четырех тысяч скважин. Показана копия экрана в момент исследования рассчитанного трехмерного образа при помощи средств динамической визуализации. Анализ конфигурации песчаных тел проводится в режиме палеореконструкции по формальным границам. Можно видеть, что стратиграфические горизонты осложнены многочисленными размывными нарушениями. Ручная корреляция в этих условиях (синие отметки) также содержит множество ошибок.
Источники
wikipedia.org Википедия Свободная энциклопедия
sources.ru статистика: общие алгоритмы
xumuk.ru Сайт о химии
kroufr.ru КРОУФР
Опубликовано на forexAW.com: Среда, 1 Сентябрь, 2010 года — 08:30.
Последнее редактирование: Воскресенье, 10 Июль, 2011 года — 17:43.
| Выберите канал. |
Видео аналитика форекс
Аналитика от Верникова
Выступления Хазина
Видео аналитика Финанс Украина
Мысли от SDGtrade
Аналитика от Arsagera
Аналитика от Делфин ФХ
Аналитика Теле Трейд
Авторская аналитика форекс
Аналитика Финам
Аналитика Форекс Клуб
Аналитика MarketVisionTV
Текущее на Финам ФМ
Комменты РосБалта
Аналитика от Leverage Forex
Анализ Forex Club
Аналитика - Forex Online
Аналитика от ITinvest
Аналитика Макси Форекс
Аналитика от United Traders
Аналитика Daily FX
Аналитика - Forex Trading
Анализ от Stock Market
Аналитика Евро / Spot Euro
Аналитика - Forex News
Аналитика - Форекс трейдинг
Аналитика Forex TV
Аналитика трейдинг
Аналитика от RANsquawk
Аналитика - Прогноз форекс
Форекс Маркет (аналитика)
Потоковое ТВ
РБК
Блумберг
Радио о финансах
Радио Форекс
Business FM
|