Новости
Ракурс
Космическое излучение

Межгалактическая угроза для наших компьютеров. Как защититься?

1 дек 2018, 18:14

В начале 80-х годов прошлого века инженеры компании IBM столкнулись с проблемой. На большей части территории США в случае отказа модуля памяти компьютера нескольких стандартных тестов было достаточно, чтобы диагностировать источник неисправности. Но в Денвере, штат Колорадо, 80% отказов не находили объяснения. Все тесты показывали, что модули работают идеально. Специалистам компании удалось в конце концов разгадать эту загадку, обнаружив источник проблем в других мирах, в тысячах и миллионах световых лет от нашей планеты. Это были не инопланетяне, как кто-то из читателей мог подумать, а космические лучи.

Невидимые пришельцы

Эти межгалактические путешественники могут повреждать электронику, и сегодня они оказывают все большее влияние на решения, применяемые в разработке компьютеров. Космические лучи — это крошечные частицы, обычно ядра водорода или гелия. Извергаемые взрывами сверхновых звезд или другими катаклизмами космического масштаба, они летят к Земле со скоростью 99% от скорости света.

Ученые еще в середине прошлого века выяснили, что радиация крайне негативно воздействует на электронику, независимо от того, что ее излучает — Солнце или взрыв атомной бомбы. Космические аппараты, запускаемые человеком, уже многие десятилетия сталкиваются с проблемой космической радиации. Но здесь, на Земле, все почему-то были убеждены, что нас защищает атмосфера. И она действительно оберегает, если так можно выразиться, от прямых попаданий. Но дело в том, что космические лучи «нашпигованы» энергией. Когда их частицы врезаются в молекулы, из которых состоит наш воздух, они никуда не исчезают. Наоборот, столкновение порождает целый выводок других частиц, называемых вторичными лучами, каждый из которых слабее космического, но все равно обладает очень высокой скоростью. Большинство вторичных лучей поглощаются или отражаются другими молекулами воздушной среды. Но время от времени они все же достигают поверхности планеты. И что же они там встречают? Правильно, электронику!

 

Внутри вашего компьютера, как вы наверняка знаете, непрерывно перемещаются электроны. Это физическое воплощение тех же смайликов, программного обеспечения, сериалов и фильмов. Многие из этих частиц находятся в памяти компьютера — так называемых чипах. Они пребывают в постоянном движении вокруг этих микроскопических электронных хранилищ, все время входят и выходят из них, чтобы помнить те единицы и нули, которые называются битами информации.

Временные неполадки

Теперь представим, что нейтрон вторичного луча врезается в ядро атома кремния, из которого изготовлен чип памяти, и сообщает ему энергию, достаточную для того, чтобы разрушить это ядро. Происходит микроскопическая реакция ядерного деления, та самая, которая используется в полезных целях в атомных реакторах. Положительно заряженные осколки ядра проносятся по чипу, выбивая электроны, имеющие отрицательный заряд. Иногда в результате реакции затрагивается до нескольких тысяч электронов одного чипа памяти. Когда это происходит, единицы становятся нулями и наоборот.

Зарегистрированы случаи, когда космические лучи портили содержимое компьютерной памяти. Ученые называют это явление «повреждением в результате единичного события» (single-event upset, SEU). Единичное событие означает в данном случае, что чип не получил постоянных повреждений. То есть если вы проверите память после него, все тесты пройдут успешно. Это то, что называется «кратковременной ошибкой».

Вторичные лучи встречаются повсюду, но чем выше вы находитесь, тем больше шансов у нейтрона встретиться с вами, так как между вами и ним на высоте гораздо меньше молекул воздушной среды, чем на уровне моря. Вот почему компьютеры в Денвере, расположенном на высоте около 1,5 км, были более подвержены временным отказам памяти. Проблема, как видим, нашла свое объяснение.

Последствия: серьезные и не очень

Большая часть SEU, если не считать периодических «синих экранов смерти», не вызывает сколько-нибудь заметных проблем. Вы же не откажетесь от просмотра очередной серии «Игры престолов», если где-нибудь на экране монитора будет выпадать один пиксель? Однако время от времени события приобретают гораздо более драматический характер. Так, например, в 2003 году компьютер, подсчитывавший итоги голосования в бельгийской коммуне Скарбек, добавил 4096 голосов одному из кандидатов всего из-за одного ошибочного бита. В 2008 году пассажирский лайнер австралийской авиакомпании Qantas неожиданно спикировал на несколько сотен метров за 20 секунд. Непристегнутых пассажиров припечатало к потолку самолета. Трудно утверждать наверняка, но наиболее правдоподобным объяснением в обоих случаях является воздействие космических лучей. Аэрокосмическая индустрия провела огромную исследовательскую работу, чтобы защитить электронику от радиации и предотвратить инциденты, подобные тому, который произошел с австралийским лайнером.

 

Иллюстрация: wikipedia.org

Устройства с большим объемом компьютерной памяти и те, что функционируют непрерывно, также нуждаются в дополнительной защите. Это касается суперкомпьютеров, серверных ферм и сетевого оборудования. По мере развития технологий SEU начинают представлять угрозу даже для сотовых телефонов, бортовых компьютеров автомобилей и устройств масштаба умных дверных звонков. Электронные схемы становятся все компактнее, в результате чего увеличивается риск ошибочного инвертирования разрядов. В то же время мы продолжаем впихивать в наши компьютеры все больше транзисторов, основных кремниевых компонентов чипов и другой электроники, предоставляя высокоэнергетическим частицам больше целей для разрушения.

Работа над ошибками

В настоящее время инженеры работают над тремя линиями защиты. Первая — изменение разбивки компонентов транзисторов таким образом, чтобы ограничить количество заряда, которое может перемещаться между ними. Это поможет минимизировать вероятность ошибок. Вторая стратегия заключается в том, чтобы обнаруживать и исправлять ошибки непосредственно в чипе памяти. Память с коррекцией ошибок, она же ECC-память (от Error Checking and Correcting) отслеживает количество единиц, которое должно быть в каждом блоке памяти, что позволяет чипу обнаруживать ошибку и возвращать битам правильные значения. ECC-память широко используется в центрах обработки данных. Приобрести ее можно и для персонального компьютера.

И, наконец, третий подход к решению проблемы заключается в том, что вы признаете возможность ошибок и пытаетесь обойти их. Наиболее ярко эта тактика проявляется при проектировании космических аппаратов и самолетов, чьи электронные схемы дублируются по несколько раз. Любые вычисления в них начинаются заново, если результаты не сходятся хотя бы по одному контуру.

Кроме того, можно использовать специальные программы для поиска подозрительных данных или просто до определенного момента мириться с некоторой неточностью результатов. У каждого из решений есть своя цена, которая может выражаться в мощности, размере, скорости или деньгах. Но иногда это того стоит, особенно если от электроники зависит человеческая жизнь.

По мере того как количество электроники повсеместно увеличивается, а ее размеры неуклонно уменьшаются, мы должны уделять все больше внимания защите от космических лучей, которые бомбардируют нашу планету из глубин Вселенной. Но мы все знаем, что люди поднаторели в выживании даже в самой враждебной среде. Да, нам понадобится огромный объем работы в области математики и физики, чтобы сохранить свой нынешний, компьютеризированный образ жизни, но разве у кого-то есть сомнения, что нам это по силам?

Подготовила Ольга ШОКИНА


Заметили ошибку?
Выделите и нажмите Ctrl / Cmd + Enter