Kernel panic

Linux 2.6 не может смонтировать корневую файловую систему.

Kernel panic (с англ. — «тревога, сбой в ядре», дословно паника ядра) — сообщение о критической ошибке ядра операционной системы, после которой операционная система не может продолжать дальнейшую работу[1].

Обычно этот термин применяется в среде операционных систем типа UNIX. Её имя связано с текстом ошибки вида «Kernel panic: …» и именем функции ядра panic() из оригинальной ОС UNIX[2].

Kernel panic возможен на Android, который базируется на ядре Linux, и в самих Linux-системах. Поскольку Mac OS X и iOS базируются на Darwin, являющейся подсемейством UNIX-систем, они также подвержены kernel panic[3].

История

Кен Томпсон и Деннис Ритчи, создатели UNIX и концепции kernel panic.

История Kernel panic тесно связана с историей операционной системы UNIX, которая была разработана в конце 1960-х годов сотрудниками Bell Labs, — в первую очередь Кеном Томпсоном, Деннисом Ритчи и Дугласом Макилроем.

Сообщение Kernel panic было введено в ранних версиях UNIX и представляло собой важное отличие в философии этой операционной системы от Multics — главного конкурента на то время и предшественника UNIX. Multics был разработан для работы на 36-битном мейнфрейме GE-645, в то время как UNIX разрабатывался для гораздо менее мощного 18-битного мини-компьютера PDP-7 и по этой причине UNIX было доступно меньше ресурсов, что привело к необходимости их экономии, в том числе и при обработке ошибок. Разработчик Multics Том ван Влек так описывает это изменение в дискуссии с разработчиком UNIX Деннисом Ритчи[4]:

Я сказал Деннису, что примерно половина кода, который я написал для Multics, была кодом обработки ошибок. Он ответил: «Мы всё это отбросили. Если произошла ошибка, у нас есть процедура под названием panic, и если она вызвана, компьютер зависает и вы кричите: „Эй, перезапустите его!“».

Изначальная функция panic() принципиально не менялась от UNIX V5 до базирующихся на VAX систем 32V и выводила только сообщение об ошибке без дополнительной информации, после чего система переводилась в бесконечный пустой цикл. Позже — в процессе развития UNIX — функция panic() была доработана и стала выводить на терминал разнообразную информацию, необходимую для отладки.

Подобный принцип обработки критических ошибок был перенят большинством более поздних операционных систем[источник?], например Mac OS[3] или Microsoft Windows[5].

Причины появления

Сообщение об аппаратной ошибке и Kernel panic.

Одной из самых распространённых причин kernel panic является невозможность найти и смонтировать корневую файловую систему. Часто это ошибка конфигурации, которая может быть исправлена при перезагрузке ядра вручную[6][не соответствует источнику].

В Linux возникновению паники ядра зачастую предшествует состояние под названием «oops». В ряде случаев «oops» может приводить к такому же неработоспособному состоянию системы, как и паника ядра[1].

В большинстве остальных случаев причиной Kernel panic является критическая аппаратная ошибка (отказ оперативной памяти, ошибка процессора, материнской платы, видеокарты или иного критически важного устройства) или ошибка в самом ядре ОС (например, попытка обращения к неверному или запрещённому адресу в памяти). Также причиной для Kernel panic могут быть ошибки в драйверах аппаратных (в частности периферийных) устройств или ошибки в файловой системе[3][7]. Во время финальной стадии инициализации пространства пользователя kernel panic обычно возникает тогда, когда не удаётся запустить init, так как, несмотря на запущенное и работоспособное ядро, сама система все ещё остаётся в нерабочем состоянии[8].

Kernel panic может быть вызван и прикладной программой, если та некорректно работает с ядром. Так в 2012 году ошибка в Google Chrome вызывала Kernel panic в Mac OS X[9].

Исходный код функции panic()

Исходный код функции panic() в UNIX V6[10][значимость факта?]:

 char    *panicstr;
 /*
  * Panic is called on unresolvable
  * fatal errors.
  * It syncs, prints "panic: mesg" and
  * then loops.
 */
 panic(s)
 char *s;
 {
 	panicstr = s;
 	update();
 	printf("panic:%s\n", s);
 	for(;;)
 		idle();
 }

Обработка Kernel panic

В нормальном случае при возникновении Kernel panic происходит аварийная остановка работы операционной системы с выдачей сообщений об ошибках на экран, после чего система ожидает выключения или перезагрузки компьютера. Однако такой механизм обработки этого события неприемлем тогда, когда простой компьютера крайне нежелателен или человека нет рядом (например, на удалённых серверах или в нерабочее время)[11].

В современных ОС (в частности в GNU/Linux, FreeBSD или Solaris) существует возможность изменить стандартное поведение функции panic() и производить перезагрузку компьютера автоматически. В GNU/Linux данная настройка осуществляется при помощи procfs[11]:

echo 5 > /proc/sys/kernel/panic

Чтобы изменения действовали в GNU/Linux и после перезагрузки, необходимо добавить в файл /etc/sysctl.d/99-sysctl.conf строку:

kernel.panic=5

Значение параметра kernel.panic — количество секунд, после которых произойдёт перезагрузка. При установке отрицательного или равного 0 значения этого параметра автоматической перезагрузка не произойдёт[11].

Также в BSD-системах есть специальная опция в ядре. Цитата из файла /usr/src/sys/conf/NOTES[12]:

# Set the amount of time (in seconds) the system will wait before
# rebooting automatically when a kernel panic occurs. If set to (-1),
# the system will wait indefinitely until a key is pressed on the
# console.
options PANIC_REBOOT_WAIT_TIME=16

В Solaris автоматическая перезагрузка после Kernel panic является стандартным поведением системы[13].

Перезагрузка после Kernel panic имеет и очень серьёзный недостаток, особенно если это изменение не пропадает после первой перезагрузки. В случае, если перезагрузка не устраняет ошибку, вызывавшую Kernel panic, система будет останавливаться и перезапускаться вновь и вновь, что может привести к аппаратным ошибкам или потерям данных[6]. В случае если такая ситуация возникла после сборки нового ядра, решением проблемы может стать загрузка сохранённой копии старого работающего ядра. Как правило, для этого достаточно вручную указать при загрузке путь к работоспособной копии ядра[14].

Для изучения причины паники ядра Linux может пригодиться файл System.map[15].

Kernel panic в различных операционных системах

Kernel panic в Mac OS X версии 10.6 и ниже.

Изначально сообщение о Kernel panic ограничивалось коротким текстом о необходимости перезагрузки системы. В современных системах обычно выдается больше дополнительной информации.

  • GNU/Linux и большинство других UNIX-совместимых операционных систем создают лог с описанием ошибки и выводят на экран сообщение об ошибке, содержащее информацию, необходимую для отладки и поиска причин этой ошибки. Этот механизм носит название Linux oops. В современных дистрибутивах Linux используется графический сервер X Window, и Kernel panic не приводит к переключению на физическую консоль, на которую выводятся диагностические сообщения. Распознать Kernel panic можно по мигающим светодиодам Caps Lock и Scroll Lock на клавиатуре[16].
  • В изначальных версиях Mac OS X (от 10.0 до 10.0.1.5) по аналогии с операционными системами, базирующимися на ядре Linux, на экран выводилась информация о произошедшей ошибке, после чего система останавливалась. Начиная с версии Mac OS X 10.2 это сообщение было упрощено и указывает лишь на необходимость перезапустить компьютер на нескольких языках (английском, немецком, французском, испанском и японском) вне зависимости от языковой версии операционной системы[3][17]. Однако OS X позволяет[17] заменить изображение на любое другое, что дает возможность разработчикам показывать изменённые сообщения об ошибках в различных ситуациях[17]. Благодаря этой возможности на OS X возможно даже симулировать синий экран смерти операционной системы Windows, заменив стандартное изображение скриншотом соответствующего изображения Windows[17].

В не-UNIX операционных системах

В то время как термин Kernel panic употребляется в основном для UNIX-совместимых операционных систем, в других операционных системах обработка критических ошибок методом остановки системы тоже прижилась и получила следующие названия:

  • В большинстве версий Microsoft Windows система останавливается с выдачей голубого экрана с кратким описанием ошибки[5], который получил название синий экран смерти (англ. Blue Screen of Death – BSoD). В операционной системе Windows XP при возникновении ошибки компьютер перезагружается автоматически. Это поведение системы управляется через панель управления Windows. Если ошибка происходит при загрузке ОС, изменить поведение системы можно через меню кнопки F8[5].
  • В старых компьютерах Macintosh: Sad Mac (аппаратная ошибка при запуске системы)[18], Bomb[англ.] (для ошибок программ или операционной системы)[19].
  • На компьютерах Amiga в AmigaOS до 2.04 этот механизм назывался Guru Meditation и работал аналогично Kernel panic в Unix[20]. В последующих версиях текст «Guru meditation» был удалён из сообщения об ошибке[20].

См. также

Примечания

  1. 1 2 Kirkland, Tinker, 2006, p. 51.
  2. Информация о функции panic() на сайте UNIX.com. BSD manpage on The UNIX and Linux Forums (11 августа 1995). Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
  3. 1 2 3 4 Причины Kernel panic в Mac OS X. macmaps.com. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
  4. Unix and Multics. www.multicians.org (21 марта 1993). Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
  5. 1 2 3 Информация о поведении Windows в нештатных ситуациях. Microsoft Corp.. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
  6. 1 2 Karim Yaghmour, Jon Masters, Gilad Ben-Yossef, Philippe Gerum, 2008, p. 170.
  7. Информация о причинах Kernel panic на сайте Apple. Apple Inc.. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
  8. Wolfgang Mauerer. Professional Linux Kernel Architecture (неопр.). — John Wiley and Sons, 2008. — С. 1238—1239. — ISBN 978-0-470-34343-2. Архивировано 15 декабря 2016 года.
  9. Google comes clean: Yes, your kernel panic is Chrome's fault. Betanews (7 января 2012). Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
  10. Исходный код prf.c UNIX V6. Unix-tree. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
  11. 1 2 3 Kopper, 2005, p. 178.
  12. OpenBSD SYSCTL.CONF man page. OpenBSD. Дата обращения: 24 июля 2012. Архивировано 6 августа 2012 года.
  13. Solaris System Engineers, 2009, p. 9.3.4.2.
  14. Michael Urban, Brian Tiemann, 2002, p. 172.
  15. Michael Schwarz, 2002, p. 21.
  16. Kirkland, Tinker, 2006, p. 52.
  17. 1 2 3 4 A New Screen of Death for Mac OS X. Amit Singh. Дата обращения: 30 июля 2012. Архивировано 6 августа 2012 года.
  18. Ted Landau, 2000, p. 133.
  19. Ted Landau, 2000, p. 83.
  20. 1 2 Eric S. Raymond, 1996, p. 230.

Литература

Ссылки