Сфера это множество наборов: Кафедра математического анализа — Кафедра математического анализа

История и возможности воплощения идеи / Хабр

Общепринятый приоритет в изобретении концепции колоссального космического сооружения, обозначаемого термином «Сфера Дайсона», принадлежит англо-американскому ученому Фримену Дайсону. Но, как и всегда в истории, если хорошо поискать, то можно найти предшественников, излагавших нечто похожее, заложивших некие основы, опираясь на которые наш современник Дайсон смог предложить такую дерзновенную идею.

Сам Фриман Дайсон признавал, что вдохновился идеей из фантастического романа «Создатель Звезд» («The Star Maker», Olaf Stapledon), автор которого Олаф Стэпледон описал похожее сооружение (кольца вокруг звезд без планет и новые искусственные планеты) ещё в 1937 году.

Но и Олаф Стэпледон мог позаимствовать идею у ещё одного автора: Джон Десмонд Бернал ( J. D. Bernal, «The World, the Flesh, and the Devil») в статье «Мир, Плоть и Дьявол» описывал сферические космические колонии, построенные из тонких оболочек вокруг перемещенных на новые орбиты астероидов.

Он также неявно намекал, что когда таких колоний станет много, то тогда они будут перехватывать большую часть энергии нашего светила.

Основоположник космонавтики, наш соотечественник Константин Эдуардович Циолковский, тоже предлагал обитаемые космические колонии, но не в форме сферы, а в форме пирамиды или конуса, развернутые прозрачным основанием в сторону Солнца (с растениями и обитателями, расположенными на стенках конуса) – так называемые «эфирные города». Причём тут сфера Дайсона? А при том, что на приведенной ниже картинке из дневника Циолковского видно, что он изображал эти конусы именно объединенными в упорядоченную сеть (чем не часть сферы Дайсона?) с помощью неких балок или тросов, проходящих через центры этих объектов (слева внизу):

Помимо этих авторов американский фантаст Раймонд З. Галлун (Raymond Z. Gallun) тоже излагал нечто похожее.
Ещё в средневековье (XV век), итальянский мыслитель XV века Марсилио Фичино, предвидя возможности человека в будущем (интуитивно ощущая, что возможности человека развиваются на основе познания, т.

е. точных знаний человека о законах природы) совершенно самоуверенно (для своего времени) написал:

Человек измеряет землю и небо… Ни небо не представляется для него слишком высоким, ни центр земли слишком глубоким… А так как человек познал строй небесных светил, то кто станет отрицать, что гений человека почти такой же, как у самого творца небесных светил, и что он некоторым образом мог бы создать эти светила, если бы имел орудия и небесный материал.

Поразительные слова, как бы предвещающие дерзания будущих покорителей космоса! — замечает Лев Любимов, автор той книги по искусству (и там оказывается пишут про астрономию!), где я прочел эти строки («Небо не слишком высоко» – золотой век итальянской живописи, серия «В мире прекрасного», Лев Любимов, Москва,

Детская литература

,

1979

).

Надо заметить, что хотя сфера Дайсона это не аналог светила — звезды или планеты, но она в некотором смысле использует первое и заменяет второе. Под сферой Дайсона можно понимать не только сферу, но любую конструкцию. Главное, чтобы эта конструкция была масштабной и перехватывала значительную часть излучения Солнца (а не тысячные доли процента, как существующие в нашей системе планеты). Конечно, итальянец Марсилио Фичино в XV веке не мог выдумать концепцию сферы Дайсона (ему не хватало знаний) и просто мечтал о создании подобия природных небесных тел, но тем не менее он смог обозначить в своем коротком тексте три из четырех основных проблем по созданию цивилизацией сферы Дайсона:

1. Метод создания – каким «некоторым образом» можно создать сферу, радиусом 50-250 миллионов километров?
2. Средства создания – какими «орудиями» можно создавать такую сферу, чтобы не навредить себе и всей своей системе?
3. Материал для создания – тот самый «небесный материал«, который определяет своим наличием, количеством и качеством саму возможность создания такой сферы (а также методы и скорость строительства).
4. Место расположения – которое нужно определить заранее, до строительства, чтобы потом не оказалось, что наличие сферы в этом месте только усложняет жизнь цивилизации или просто опасно для своей системы.

Начнем с последней проблемы – с места расположения сферы, так как это самое важное решение, заметно влияющее на последующие. И ответ на вопрос о размещение сферы напрямую зависит от назначения сферы.

Классификация по расположению

Вариант А: Если нам нужна сфера Дайсона просто для получения максимума энергии от Солнца (без учета сохранения освещенности планет, особенно освещенности Земли), то было бы логичнее расположить сферу как можно ближе к Солнцу.

Возникают три основные проблемы:

  1. Проблема гравитационной устойчивости и стабильности — сфера не должна падать на Солнце, ломаться или деформироваться от гравитации Солнца, а также от гравитации ближайших планет (Меркурия и Венеры).
  2. Проблема охлаждения сферы — сфера не должна плавиться или деформироваться от энергии Солнца.
  3. Если проблема охлаждения решена, то остается проблема переноса массы с Солнца на сферу – солнечный ветер и коронарные выбросы будут достигать поверхности сферы, повреждать её, оседать на ней, утяжелять и заряжать её.

Вариант Б: Если нам нужна сфера как поверхность обитания для людей (со всей необходимой инфраструктурой, атмосферой, почвой, растениями и животными), то сфера должна быть прочной и располагаться там, где свет Солнца имеет примерно ту же интенсивность что и на поверхности Земли — т.е. на расстоянии орбиты Земли или даже дальше (чтобы скомпенсировать отсутствие или слабость атмосферы, магнитосферы, нужных для защиты от излучения Солнца).

Возникают три новые основные проблемы (выше изложенные проблемы Варианта А не исчезают, но уходят на второй план):

  1. Стабильность – сфера не должна задевать орбиты других планет (например Земли), не должна сильно притягиваться ими. Поэтому она должна быть далеко вне орбиты Земли (на 30-50 млн. км или на 0.2-0.3 а.е.).
  2. Прочность и толщина сферы – вопрос в том, достаточно ли прочная поверхность сферы: помимо технологии во многом это определяется составом и качеством материала Солнечной системы.
  3. Наличие материала – если его недостаточно, то и строить такую сферу не имеет смысла.

Вариант В: Если нам нужна сфера с тонкой примитивной (легко ремонтируемой) поверхностью, перехватывающей свет от Солнца, но не обязательно твердой (выдерживающей почву, людей), зато с максимальной площадью поверхности и с минимальным потоком энергии (чтобы не волноваться за перегрев сферы), то сфера должна располагаться где-то ещё дальше от светила.

Для такой сферы тоже актуальны три основные проблемы (остальные проблемы менее важны):

  1. Наличие материала – для такой огромной сферы его может и не хватить.
  2. Стабильность сферы — остается проблемой, но не такой срочной.
  3. Столкновения с астероидами, кометами и т.п.
    — проблема серьезнее, чем для ранее изложенных вариантов, так как поверхность такой сферы в единицу времени пересекают гораздо больше мелких небесных тел.

Классификация по назначению

Из беглого рассмотрения местоположения сферы Дайсона очевидно, что многое также определяется назначением сферы:

Назначение 1: Тесный энергетический кокон вокруг звезды

Как можно ближе к звезде создается вращающаяся (необязательно сплошная) прочная охлаждаемая оболочка с уловителями (а также преобразователями и излучателями) энергии — чтобы получить максимум энергии при минимальных объемах строительства. Как близко к Солнцу можно построить такую сферу? Если принять неопасным разогрев оболочки Солнцем до 1000 К (без специального охлаждения), то радиус будет равен около 23 млн км, что лежит внутри орбиты Меркурия (радиус его орбиты от 40 до 60 млн км) — эти расчеты взяты со списка ответов на типичные вопросы по сфере Дайсона.

Вся полученная световая энергия преобразуется в другую (например, в электрическую) и потом либо передается куда-то (например, лазером или радиоволной), либо применяется на месте. Состояние, освещенность, стабильность орбит планет и даже само их существование в расчет не принимаются – если нужно, то они разбираются на материалы для создания сферы.

Несмотря на некоторую экстремальность такого назначения сферы (нестабильность сферы надо постоянно парировать выпуском газов/солнечного ветра с разных направлений, или работой двигателей на внешней/внутренней оболочке сферы) и проблему прочности (для нашего уровня развития главной проблемой является прочности любых современных материалов) эта конструкция вполне оправдана для цивилизаций высокого уровня. Особенно если таким способом осваивается не своё светило, а чужая звезда. Это ведь не колыбель цивилизации, где разбирать или заслонять от светила планеты не поднимется рука (просто из уважения к истории своего мира), не говоря уже о нарушении стабильности орбит других планет при разборке даже одной планеты. Если такая чужая звезда имеет неудачный (с точки зрения цивилизации) спектр, не обладает пригодными для освоения и обитания планетами, то и жалеть такую систему со звездой никто особо не будет: планеты пойдут на создание сферы.

Конструкция такого вида особенно оптимальна для белых карликов: эти неактивные, медленно (миллиарды лет) остывающие остатки звезды светят стабильно: температура их поверхности остывает со средней скоростью около 10000 K за 1 миллиард лет — эта оценка основана на разнице температур нового белого карлика: от 90 000 К (оценка по линиям поглощения) или 130 000 К (оценка по рентгеновскому спектру), до температур ниже 4000 К (так называемый черный карлик) для некоторых белых карликов, остывших за 13 миллиардов лет (время жизни Вселенной). Белые карлики светят без вспышек и выбросов коронарной массы, они невелики по размерам и по светимости — вокруг них можно сделать сферу радиусом в десятки раз меньше (даже менее 1 млн. км), чем вокруг активного Солнца или других звёзд схожего размера. Но проблема прочности сферы остается.

В 2015 году двое турецких ученых рассчитали радиусы сфер Дайсона (пригодных для обитания людей на внешней прочной поверхности с комнатной температурой) для разных типов белых карликов. Результаты лежат в пределах 2-5 млн. км, а количество материала на создание такого рода сфер с толщиной оболочки около 1 м примерно равно материалу всей Луны. Эту работу заметили и в США и у нас в СМИ.

С красными карликами дело несколько сложнее: у них часто бывают вспышки, их жесткое излучение опаснее солнечного. Но и у них есть свои преимущества: их много, а их вес от 30% и вплоть до 8% от веса Солнца, значительно меньшие значения светимости и малые геометрические размеры позволяют построить сферы радиусом поменьше, чем для Солнца, а уж продолжительность их жизни далеко перекрывает и ожидаемую продолжительность жизни Солнца и время остывания белых карликов до уровня, когда получение энергии сферой уже мало.

Вывод: Данное назначение сферы Дайсона имеет смысл для определенных типов небольших звезд, но явно не для родной системы цивилизации и не для первой попытки любой цивилизации построить сферу Дайсона. Вот когда цивилизация выйдет на звездные просторы, то тогда и начнет «гасить» ближайшие звезды (особенно карлики) такими коконами, образуя тем самым в небе «пузырь Ферми» без звезд (термин Ричарда Кэрригана). В оптическом диапазоне это будет похоже на звёзды, находящимся в туманности, но при этом прилично светящиеся в ИК-диапазоне. Название «пузырь Ферми» было предложено из-за того, что подобная группа сфер Дайсона будет постепенно расширяться в соответствии предположением Энрико Ферми о скорости расширения ареала таких цивилизаций в 0,001 — 0,01 от скорости света.

Назначение 2: Огромная поверхность для заселения людьми

Самое амбициозное, трудное в создании и материально затратное назначение для сферы Дайсона. Требует воистину огромного количества материалов и ресурсов для создания. Если мы не считаем возможным разборку Земли или её затемнение, то радиус такой сферы должен быть около 190-250 млн. км (на 40-50 млн. км за земной орбитой для уменьшения взаимного влияния сферы и Земли).

В связи с простыми выводами из физических законов (Закон Гаусса) — так называемая теорема Ньютона об отсутствии гравитации внутри сферических тел (по-английски: Shell theorem) — для любой равномерно плотной сферической оболочки гравитация внутри оболочки зависит только от массы внутри (а не от массы самой оболочки). 2] = 0.04 миллиньютона.

Это вроде ерунда, какие-то мизерные доли от силы тяжести на Земле (9.8 ньютона действуют на пробный килограмм на поверхности нашей планеты). Но проблема в том, что ещё на этот килограмм оболочки давит вес всех других килограммов, составляющих сектора купола сферы снизу и сверху (см. наглядный рисунок ниже).

Да, их вес на таком расстоянии от Солнца минимален, те самые 0.04 миллиньютона, но эту мизерную силу надо векторно умножить на миллионы этих килограмм, составляющих массу сектора купола. Результирующая сила зависит от толщины оболочки и даже для сантиметровых толщин она просто ужасна (так как размеры и масса сектора купола огромна).

Если создать вращающуюся сферу (при сборке сферы из элементов, только так и надо начинать: все элементы экваториального кольца должны предварительно выводится на стабильную орбиту, что требует вращения вокруг светила со скоростями близкими к орбитальным скоростям планет: 30 км/сек для Земли или около 25 км/сек для орбиты за земной, но до марсианской), то это вращение поможет собранной жесткой оболочке сферы только на экваторе и рядом с ним. 24 кг вещества, что хватит для строительства оболочки Дайсона радиусом 1 а.е. с массой всего 42 кг/м2 и около сантиметровой толщины.

Вывод: Данное назначение сферы Дайсона имеет смысл только для идеалистических мечтаний о мощи цивилизации. Современные материалы не позволяют создать такую сферу. Кроме того никакой материал и никакие новые технологии не изменят того факта, что внутренняя поверхность сферы не пригодна для обитания в чистом виде (нужна ещё внутренняя прозрачная сфера для удержания атмосферы от падения вниз к светилу), а сама сфера опасно нестабильна. И главное: материала в нашей системе просто не хватит.

Назначение 3: Легкие концентраторы энергии звезды

Такие сферы могут быть как дальше, так и ближе земной орбиты. Главное то, что их назначение это не проживание максимального количества людей на их внутренней поверхности, а использование излучаемой Солнцем энергии, пусть и не 100% этой энергии. Эти допущения по назначению открывают широкие возможности по формам и типам конструкций. Можно выбрать ту, которая доступна текущим технологиям, не замахиваясь на нереальное. Например можно отойти от сферы к отдельным элементам, составляющих так называемый Рой Дайсона, на орбите вокруг Солнца (у Меркурия), которые получают и перерабатывают энергию и посылают её дальше потребителям.

Можно рассмотреть и элементы без преобразования энергии, которые просто посылают отраженный солнечный свет в нужном направлении (упоминается здесь). Набор таких нежестких колец (из элементов роя) с разными радиусами и углами к плоскости эклиптики может в принципе перехватывать даже больше 50% солнечного излучения, даже если кольца не сплошные (не жесткие) и между самими кольцами есть зазоры.

Да, это не сфера в геометрическом смысле слова, но вполне практичная альтернатива сфере. Главное — это отказаться от самой сферы — как говорится: Вам шашечки или доехать надо?

Вывод: данное расплывчатое назначение сферы Дайсона придает большую гибкость всей концепции и позволяет рассмотреть несколько форм и типов конструкций, с разными исходными задачами и с разными результатами, а также с разными потенциалами совершенствования и модернизации.

К такому же выводу пришел и футурист Стьюарт Армстронг, выбрав в качестве естественной перспективы для цивилизации Рой Дайсона (Dayson Swarm), построенный из материала Меркурия и расположенный примерно на его орбите: смотри то самое видео выше (с 2:50 по 4:50) на английском, с рассуждениями про разработку гематита (химическая формула Fe2O3) на Меркурии, про отражатели и коллекторы света. Этот футуристический план по «разработке всего Меркурия до конца» был замечен и у нас в официально-скандальной прессе и на сайте Popular Mechanics.

Классификация типов конструкций

Так называемый I тип сферы Дайсона это не сплошная условная сфера — Рой Дайсона (Dayson Swarm) — из отдельных, никак между собой не связанных элементов, движущихся по своим стабильным орбитам, на более-менее постоянном удалении от центрального светила. Орбиты регулируются тягой любых двигателей на самих элементах.

Так называемый II тип сферы Дайсона это не сплошная условная сфера из отдельных несвязанных элементов, парящих на постоянном удалении от центрального светила за счет баланса силы притяжения и силы давления света/солнечного ветра. 20 кг.

Отбрасывая II и III тип сферы Дайсона из-за отсутствия на данный момент (и в обозримом будущем) подобных материалов мы снова приходим к рою Дайсона — к сфере I типа, просто потому, что она реальнее всех остальных типов.

Есть и другие, экзотичные типы конструкций (к примеру тут), но все они ещё сложнее и нереальнее.

Сфера Дайсона начинается с Кольца

Рассмотрим сам процесс создания Сферы Дайсона, точнее Роя Дайсона в виде Кольца.

С чего техническая цивилизация начнет монтаж любой сферы Дайсона? С вывода отдельных элементов сферы на орбиту. Только элементы сферы Дайсона, двигающиеся по стабильной круговой орбите с нужным радиусом, могут быть собраны вместе (без жесткого соединения, с зазорами), чтобы постепенно шаг за шагом сформировать… увы, не сферу, а только кольцо, так как чем выше или ниже элемент над плоскостью кольца, тем сложнее его поставить на стабильную орбиту, не пересекающую уже созданное кольцо и не сильно удаленное от него по радиусу. Хотя есть прикидки, как сделать много индивидуальных непересекающихся орбит для элементов. Например, красивый вариант с разными восходящими узлами орбиты и перицентрами (но с одинаковым наклонением и радиусом) — этот вариант Роя с максимальным количествои индивидуальных орбит в виде «кружевного» тора под названием Jenkins Swarm (Рой Дженкинса) использован для картинки на обложке этой статьи.

Монтаж скорее всего начнется со сборки части кольца Дайсона в плоскости эклиптики. Ведь вне плоскости эклиптики меньше астероидов и другого материала для создания элементов кольца. А в плоскости эклиптики и материала больше, и доставить на нужный радиус этот материал легче, и придать ему (или уже построенному элементу кольца) нужную орбитальную скорость проще. Назовем такую нежесткую конструкцию из отдельных близко расположенных элементов роя Кольцом Дайсона (так как Кольцо Нивена по определению обязательно жесткое).

После создания гибкого (состоящего из несвязанных или слабо связанных элементов) кольца заданного радиуса, с накоплением опыта и усовершенствованием технологии, цивилизации можно создавать и другие кольца, уже поперек плоскости эклиптики и под углом к ней, но эти кольца должны быть с заметно увеличенным или уменьшенным радиусом, чтобы не задевать первоначальное кольцо.

Это всё по первой части статьи: история идеи бегло рассмотрена и выбран оптимально-реализуемый вариант сферы Дайсона.

Во второй части статьи рассматривается метод строительства Кольца Дайсона на основе роя из стандартных, автономных элементов. Рассчитываются параметры такого Кольца для Солнечной системы с двумя вариантами расположения Кольца: до орбиты Земли (за орбитой Венеры, поближе к Солнцу) и за орбитой Земли (до орбиты Марса). Также подробно рассматривается стандартный элемент такого Кольца, его геометрические и весовые параметры и возможные функции.

В третьей части статьи раскрываются цели построения такого Кольца, способы его применения и способы нестандартного применения отдельных автономных элементов Кольца вне самой орбиты Кольца. Также обсуждается проблема обнаружения такого гигантского сооружения извне.

Введение в анализ ассоциативных правил

Объемы современных баз данных, которые весьма внушительны, вызвали устойчивый спрос на новые масштабируемые алгоритмы анализа данных. Одним из популярных методов обнаружения знаний стали алгоритмы поиска ассоциативных правил. Ассоциативные правила позволяют находить закономерности между связанными событиями. Примером такого правила, служит утверждение, что покупатель, приобретающий «Хлеб», приобретет и «Молоко» с вероятностью 75%.

Внушительные объемы современных баз данных вызвали устойчивый спрос на новые масштабируемые алгоритмы анализа данных. Одним из популярных методов обнаружения знаний стали алгоритмы поиска ассоциативных правил.

Ассоциативные правила позволяют находить закономерности между связанными событиями. Примером такого правила служит утверждение, что покупатель, приобретающий «Хлеб», приобретет и «Молоко» с вероятностью 75%. Первый алгоритм поиска ассоциативных правил был разработан в 1993 году сотрудниками исследовательского центра IBM Almaden и назывался AIS [1]. С этой пионерской работы возрос интерес к ассоциативным правилам. На середину 90-х годов прошлого века пришелся пик исследовательских работ в этой области, и с тех пор каждый год появлялось по несколько алгоритмов.

Ассоциативные правила (Association Rules)

Впервые задача поиска ассоциативных правил была предложена для нахождения типичных шаблонов покупок, совершаемых в супермаркетах, поэтому иногда ее еще называют анализом рыночной корзины (market basket analysis).

Пусть имеется база данных, состоящая из покупательских транзакций. Каждая транзакция — это набор товаров, купленных покупателем за один визит. Такую транзакцию еще называют рыночной корзиной.

Определение 1. Пусть I = \{i_1,\,i_2,\,i_3,\,\dots,\,i_n\} — множество (набор) товаров, называемых элементами. Пусть D — множество транзакций, где каждая транзакция T — это набор элементов из I, T\subseteq I. Каждая транзакция представляет собой бинарный вектор, где t[k]=1, если i_k элемент присутствует в транзакции, иначе t[k]=0. Мы говорим, что транзакция T содержит X, некоторый набор элементов из I, если X\subset T. Ассоциативным правилом называется импликация X\Rightarrow Y, где X\subset I, Y\subset I и X\cap Y=\oslash. Правило X⇒Y имеет поддержку s (support), если s% транзакций из D, содержат X\cup Y, supp(X\Rightarrow Y) = supp(X\cup Y). Достоверность правила показывает какова вероятность того, что из X следует Y. Правило X⇒Y справедливо с достоверностью (confidence) c, если c% транзакций из D, содержащих X, также содержат Y, conf(X\Rightarrow Y) = supp(X\cup Y)/supp(X).

Покажем на конкретном примере: 75% транзакций, содержащих хлеб, также содержат молоко. 3% от общего числа всех транзакций содержат оба товара». 75% — это достоверность (confidence) правила, 3% это поддержка (support), или «Хлеб» «Молоко» с вероятностью 75%.

Другими словами, целью анализа является установление следующих зависимостей: если в транзакции встретился некоторый набор элементов X, то на основании этого можно сделать вывод о том, что другой набор элементов Y также же должен появиться в этой транзакции. Установление таких зависимостей дает нам возможность находить очень простые и интуитивно понятные правила.

Алгоритмы поиска ассоциативных правил предназначены для нахождения всех правил XY, причем поддержка и достоверность этих правил должны быть выше некоторых наперед определенных порогов, называемых соответственно минимальной поддержкой (minsupport) и минимальной достоверностью (minconfidence).

Задача нахождения ассоциативных правил разбивается на две подзадачи:

  1. Нахождение всех наборов элементов, которые удовлетворяют порогу minsupport. Такие наборы элементов называются часто встречающимися.
  2. Генерация правил из наборов элементов, найденных согласно п.1. с достоверностью, удовлетворяющей порогу minconfidence.

Один из первых алгоритмов, эффективно решающих подобный класс задач, — это алгоритм APriori [2]. Кроме него были разработаны и другие алгоритмы: DHP[5], Partition[6], DIC[7] и другие.

Значения для параметров минимальная поддержка и минимальная достоверность выбираются таким образом, чтобы ограничить количество найденных правил. Если поддержка имеет большое значение, то алгоритмы будут находить правила, хорошо известные аналитикам или настолько очевидные, что нет никакого смысла проводить такой анализ.

С другой стороны, низкое значение поддержки ведет к генерации огромного количества правил, что, конечно, требует существенных вычислительных ресурсов. Тем не менее, большинство интересных правил находится именно при низком значении порога поддержки. Хотя слишком низкое значение поддержки ведет к генерации статистически необоснованных правил.

Поиск ассоциативных правил совсем не тривиальная задача, как может показаться на первый взгляд. Одна из проблем — алгоритмическая сложность при нахождении часто встречающихся наборов элементов, т.к. с ростом числа элементов в I (| I |) экспоненциально растет число потенциальных наборов элементов.

Обобщенные ассоциативные правила (Generalized Association Rules)

При поиске ассоциативных правил мы предполагали, что все анализируемые элементы однородны. Возвращаясь к анализу рыночной корзины, это товары, имеющие совершенно одинаковые атрибуты, за исключением названия. Однако не составит большого труда дополнить транзакцию информацией о том, в какую товарную группу входит товар и построить иерархию товаров. Приведем пример такой группировки (таксономии) в виде иерархической модели.

Пример иерахической модели

Пусть нам дана база транзакций D и известно в какие группы (таксоны) входят элементы. Тогда можно извлекать из данных правила, связывающие группы с группами, отдельные элементы с группами и т.д.

Например, если Покупатель купил товар из группы «Безалкогольные напитки», то он купит и товар из группы «Молочные продукты» или «Сок» «Молочные продукты». Эти правила носят название обобщенных ассоциативных правил.

Определение 2. Обобщенным ассоциативным правилом называется импликация X \Rightarrow Y, где X \subset I, Y\subset I и X \cap Y=\oslash и где ни один из элементов, входящих в набор Y, не является предком ни одного элемента, входящего в X. Поддержка и достоверность подсчитываются так же, как и в случае ассоциативных правил (см. Определение 1).

Введение дополнительной информации о группировке элементов в виде иерархии даст следующие преимущества:

  1. Это помогает установить ассоциативные правила не только между отдельными элементами, но и между различными уровнями иерархии (группами).
  2. Отдельные элементы могут иметь недостаточную поддержку, но в целом группа может удовлетворять порогу minsupport.

Для нахождения таких правил можно использовать любой из вышеназванных алгоритмов. Для этого каждую транзакцию нужно дополнить всеми предками каждого элемента, входящего в транзакцию. Однако, применение «в лоб» этих алгоритмов неизбежно приведет к следующим проблемам:

  1. Элементы на верхних уровнях иерархии стремятся к значительно большим значениям поддержки по сравнению с элементами на нижних уровнях.
  2. С добавлением в транзакции групп увеличилось количество атрибутов и соответственно размерность входного пространства. Это усложняет задачу, а также ведет к генерации большего количества правил.
  3. Появление избыточных правил, противоречащих определению обобщенного ассоциативного правила, например, «Сок» «Прохладительные напитки». Очевидно, что практическая ценность такого «открытия» нулевая при 100% достоверности. Следовательно, нужны специальные операторы, удаляющие подобные избыточные правила.

Для нахождения обобщенных ассоциативных правил желательно использование специализированного алгоритма[3], который устраняет вышеописанные проблемы и к тому же работает в 2-5 раз быстрее, чем стандартный APriori.

Группировать элементы можно не только по вхождению в определенную товарную группу, но и по другим характеристикам, например по цене (дешево, дорого), брэнду и т.д.

Численные ассоциативные правила (Quantitative Association Rules)

При поиске ассоциативных правил задача была существенно упрощена. По сути все сводилось к тому, присутствует в транзакции элемент или нет. Т.е. если рассматривать случай рыночной корзины, то мы рассматривали два состояния: куплен товар или нет, проигнорировав, например, информацию о том, сколько было куплено, кто купил, характеристики покупателя и т.д. И можно сказать, что рассматривали «булевские» ассоциативные правила. Если взять любую базу данных, каждая транзакция состоит из различных типов данных: числовых, категориальных и т. д. Для обработки таких записей и извлечения численных ассоциативных правил был предложен алгоритм поиска [4].

Пример численного ассоциативного правила: [Возраст: 30-35] и [Семейное положение: женат] [Месячный доход: 1000-1500 тугриков].

Помимо описанных выше ассоциативных правил существуют косвенные ассоциативные правила, ассоциативные правила c отрицанием, временные ассоциативные правила для событий связанных во времени и другие.

Как было сказано, задача поиска ассоциативных правил впервые была представлена для анализа рыночной корзины. Ассоциативные правила эффективно используются в сегментации покупателей по поведению при покупках, анализе предпочтений клиентов, планировании расположения товаров в супермаркетах, кросс-продажах, адресной рассылке. Однако, сфера применения этих алгоритмов не ограничивается лишь одной торговлей. Их также успешно применяют и в других областях: медицине, для анализа посещений веб-страниц (Web Mining), для анализа текста (Text Mining), для анализа данных по переписи населения[7], в анализе и прогнозировании сбоев телекоммуникационного оборудования и т. д.

Литература

  1. R. Agrawal, T. Imielinski, A. Swami. 1993. Mining Associations between Sets of Items in Massive Databases. In Proc. of the 1993 ACM-SIGMOD Int’l Conf. on Management of Data, 207-216.
  2. R. Agrawal, R. Srikant. «Fast Discovery of Association Rules», In Proc. of the 20th International Conference on VLDB, Santiago, Chile, September 1994.
  3. R. Srikant, R. Agrawal. «Mining Generalized Association Rules», In Proc. of the 21th International Conference on VLDB, Zurich, Switzerland, 1995.
  4. R. Srikant, R. Agrawal. «Mining quantitative association rules in large relational tables». In Proceedings of the ACM SIGMOD Conference on Management of Data, Montreal, Canada, June 1996.
  5. A. Savasere, E. Omiecinski, and S. Navathe, «An Efficient Algorithm for Mining Association Rules in Large Databases», In Proc. 21st Int’l Conf. Very Large Data Bases, Morgan Kaufmann, San Francisco, 1995.
  6. J.S. Park, M.-S. Chen, and S.Y. Philip, «An Effective HashBased Algorithm for Mining Association Rules», In Proc. ACM SIGMOD Int’l Conf. Management of Data, ACM Press, New York, 1995.
  7. S. Brin et al., «Dynamic Itemset Counting and Implication Rules for Market Basket Data», In Proc. ACM SIGMOD Int’l Conf. Management of Data, ACM Press, New York, 1997.
  8. J. Hipp, U. Guntzer, and G. Nakaeizadeh. Algorithms for Association Rule Mining – A General Survey and Comparison. In Proc. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2000.

 

Другие материалы по теме:

Выявление обобщенных ассоциативных правил

Apriori — масштабируемый алгоритм поиска ассоциативных правил 

«Ситилинк» задействует Loginom в управлении товарными запасами

Поиск последовательных шаблонов| Часть 1

 

реальный анализ — Показать сферы закрытые наборы

спросил

Изменено 4 года, 10 месяцев назад

Просмотрено 485 раз

$\begingroup$

Пусть $(X,\mathcal T)$ — топологическое пространство, тогда подмножество $H \subset X$ определяется как замкнутое множество $X$, если $X-H$ открыто в $X$. 93$ (трехмерное евклидово пространство).

  • реальный анализ

$\endgroup$

7

$\begingroup$

Пусть $x$ — точка не на сфере. Предположим, что расстояние $x$ от начала координат равно $d$. Тогда все точки открытого шара радиуса $\frac{|d-r|}2$ с центром в точке $x$ лежат вне сферы. Поскольку открытые шары составляют основу топологии и каждая точка в дополнении имеет вокруг себя открытый шар, который полностью содержится в дополнении, дополнение сферы открыто, следовательно, сфера замкнута.

Очевидно, я упустил из виду, почему этот открытый шар не пересекает сферу. Это потому, что это требует некоторых вычислений, и я отвечаю на это по мобильному телефону. Я думаю, вы должны быть в состоянии понять эту часть.

Изменить: вопрос был отредактирован, чтобы сделать этот ответ недействительным. Я не собираюсь модифицировать его, чтобы он отвечал на новый, совершенно другой вопрос.

$\endgroup$

2

Зарегистрируйтесь или войдите в систему

Зарегистрируйтесь с помощью Google

Зарегистрироваться через Facebook

Зарегистрируйтесь, используя электронную почту и пароль

Опубликовать как гость

Электронная почта

Требуется, но никогда не отображается

Опубликовать как гость

Электронная почта

Требуется, но не отображается

Нажимая «Опубликовать свой ответ», вы соглашаетесь с нашими условиями обслуживания, политикой конфиденциальности и политикой использования файлов cookie

.

общая топология — Совершенны ли множества сфер и шаров? Какова их граница?

спросил

9n$ замкнуты (и компактны) мне понятно. Тем не менее, я думаю, что они также идеальны, поскольку у них нет изолированных точек. Это правда?

Второй момент касается их границ. Часто я читаю, что сфера не имеет границ. Однако если мы определим границу множества как множество точек дополнения к внутренности множества относительно его замыкания, мы получим, что границей сферы является сама сфера.

То есть для множества $A$ пусть $ \bar{A}$ обозначает замыкание $A$, заданное $\bar{A}=A\cup A’$, где $A’$ – множество всех предельных точек $A$. Альтернативно, $\bar{A}$ — это наименьшее замкнутое множество, в котором $A$ является подмножеством.

Пусть внутренность $A$ обозначается через $\hat{A}$, которое является множеством всех внутренних точек $A$, т. n$. Таким образом, сфера была бы замкнуто-открытой и, следовательно, не имела бы границ. 9n$ пусто.

$\endgroup$

2

$\begingroup$

Есть (по крайней мере) два независимых значения слова «граница» в литературе по топологии.

Первое значение: Для заданного топологического пространства $X$ и подпространства $A \subset X$ граница $A$ в $X$ определяется как $\overline A — \hat A$. Равным образом можно определить границу как $\overline A \cap \overline{X-A}$, и я предпочитаю это определение, потому что оно подчеркивает важную особенность границы, а именно то, что это 9м$. Наконец, граница многообразия $M$ определяется как $\partial M = M — \text{int}(M)$. Часто, когда говорят только о «многообразиях», часто опускают само слово и говорят только о внутренней части $M$ и границе $M$.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *