The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Выпуск CRIU 3.18, системы для сохранения и восстановления состояния процессов в Linux"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Выпуск CRIU 3.18, системы для сохранения и восстановления состояния процессов в Linux"  +/
Сообщение от opennews (??), 24-Апр-23, 23:03 
Опубликован выпуск инструментария CRIU 3.18 (Checkpoint and Restore In Userspace), предназначенного для сохранения и восстановления процессов в пространстве пользователя. Инструментарий позволяет сохранить состояние одного или группы процессов, а затем возобновить работу с сохранённой позиции, в том числе после перезагрузки системы или на другом сервере без разрыва уже установленных сетевых соединений.  Код проекта распространяется под лицензией GPLv2...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=59024

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по ответам | RSS]

1. Сообщение от Аноним (1), 24-Апр-23, 23:03   –9 +/
Каким образом это нововведение возможно применить в девопсе?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #2, #7

2. Сообщение от Аноним (2), 24-Апр-23, 23:11   +3 +/
Какое именно? И зачем именно в девопсе? Как мне видится невозможность сдампить GUI приложения несколько ограничивает применимость на десктопе, но всё же. Да и вроде говорили что для иксов анриал, но для вейланда возможно. Так уж получается, что какой-нибудь блендер иногда неплохо бы остановить по разным причинам.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1 Ответы: #21, #22, #23

4. Сообщение от Аноним (4), 24-Апр-23, 23:38   +3 +/
Я minecraft приостанавливал посылая SIGSTOP через htop, чтоб проц не грузил, когда на паузе
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #55

6. Сообщение от Аноним (7), 24-Апр-23, 23:41   +/
А что происходит с файловыми дескрипторами? Например, программа пишет что-то в файл на нфс-шаре, мы её резко снэпшотим. Потом - восстанавливаем на другой машине с такой же нфс-шарой. Сможет ли она продолжить писать в тот же файл?
Также сокеты иксов и пульсов. Допустим я хочу перенести граф-приложение с машины на машину. Persistent storage - тот же нфс.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #11, #26

7. Сообщение от Аноним (7), 24-Апр-23, 23:42   +4 +/
Было бы неплохо смигрировать вживую контейнер с одной машины на другую, например.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1 Ответы: #12, #40

8. Сообщение от Sw00p aka Jerom (?), 24-Апр-23, 23:47   +/
Фантом ОС изобретают :)
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #25

11. Сообщение от Dzen Python (ok), 24-Апр-23, 23:56   +1 +/
Отслеживание открытых файлов и маппинг на удаленной машине?
Дамп небольших файлов целиком с переносом образа процесса на удаленную машину?
Резолв соединений к БД на уровне внешних процессов-брокеров?

> Потом - восстанавливаем на другой машине с такой же нфс-шарой. Сможет ли она продолжить писать в тот же файл?

Если пути и окружение совпадает - то почему бы и нет? Главное - синхронизировать состояние целефого файла, гарантируя, что не было разрушающих формат дозаписей, т.к. снять мы можем в произвольный момент времени.

> А что происходит с файловыми дескрипторами?

Это как раз наименьшая проблема. Тут гораздо большая проблема с окружением (которое по умолчанию может быть очень отличным от машины, на которой сняли снапшот).

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6 Ответы: #18, #24

12. Сообщение от Dzen Python (ok), 24-Апр-23, 23:57   +/
М?
Прикладники научились писать софт, который не требует перезапусков раз в эн времени?
Или 640 петабайт оперативы уж точно должно хватить всем?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #7 Ответы: #14

14. Сообщение от 48 (?), 25-Апр-23, 00:40   +/
А что драйверов на расте писать не собираются? или системы не состоят из контейнеров внутри виртуалок, потому что никто низачто не отвечает?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #12

16. Сообщение от Аноним (16), 25-Апр-23, 01:06   +/
> в том числе после перезагрузки системы или на другом сервере без разрыва уже установленных сетевых соединений.

Это что за чёрная магия? Как это работает?

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #17

17. Сообщение от Аноним (2), 25-Апр-23, 01:43   +/
>> в том числе после перезагрузки системы или на другом сервере без разрыва уже установленных сетевых соединений.
> Это что за чёрная магия? Как это работает?

За натом работает, видимо. У меня отваливались по таймауту. Если программа рассчитана на обновление соединения то всё будет работать при этом, а так вообще никто ничего не заметит.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #16 Ответы: #27

18. Сообщение от Анонимemail (18), 25-Апр-23, 05:53   +/
это ж как мне кажется напоминает ceph из proxmox`a
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #11

19. Сообщение от Аноним (19), 25-Апр-23, 06:34   +/
Идея хорошая, а вот с реализацией проблемы. После нескольких заморозок процесс начинает глючить. Лучшее решение - это использование виртуализации и снапшотов.
Ответить | Правка | Наверх | Cообщить модератору

21. Сообщение от Аноним (21), 25-Апр-23, 07:12   –2 +/
Правильная, ядерная (никаких изменений в системном и прикладном ПО не требуется) реализация SSI кластера балансировки нагрузки между узлами (прозрачная миграция процессов) и правильная, реализация сохранения и восстановления процессов для Linux (прозрачное восстановление абсолютно всех процессов,включая все графические процессы): https://mirror.yandex.ru/mirrors/ftp.linux.kiev.ua/Linux/CD/.../

Исходники: https://sourceforge.net/projects/monitoring/files/hardened-o.../

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2

22. Сообщение от Аноним (21), 25-Апр-23, 07:19   +2 +/
>  и вроде говорили что для иксов анриал

Лгут тебе. Выше ссылки на LiveCD и исходники ядра Linux, все оттестировано и работает.

Жаль, не смогли протолкнуть эти, ПРАВЕЛЬНЫЕ, технологии в официальное ядро. Победила красная шляпа с cgroups, namespaces, systemd+dbus+polkit.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2 Ответы: #69

23. Сообщение от Аноним (21), 25-Апр-23, 07:24   +/
> и вроде говорили что для иксов анриал, но для вейланда возможно

Насколько помню события 15-летней давности там разрабы поругались с технологиями cgroup, namespaces если их выкинуть с ядра, то уже есть реализация и для X11: https://sourceforge.net/projects/monitoring/files/hardened-o.../

А вейленд такое же нинужгое зло как и сыстемды с дбас.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2 Ответы: #58

24. Сообщение от Аноним (24), 25-Апр-23, 08:24   +/
> Тут гораздо большая проблема с окружением (которое по умолчанию может быть очень отличным от машины, на которой сняли снапшот).

Допустим у нас контейнер, содержимое которого рсинхаем перед расснапшочиванием.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #11

25. Сообщение от Аноним (24), 25-Апр-23, 08:24   +/
Нет. Иначе повторят его судьбу.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #8 Ответы: #33

26. Сообщение от Tron is Whistling (?), 25-Апр-23, 08:42   +/
Главное чтобы файл за это время измениться не успел.
Иначе будет ПРИКОЛЬНО111!!!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #6 Ответы: #65

27. Сообщение от Tron is Whistling (?), 25-Апр-23, 08:44   +/
Да а в чём магия-то? Дескриптор сокета и прочее переносится со всей сопутствующей инфой.
Если удалённая сторона стаймаутится не успеет - всё будет ок. У меня так SSH-сеансы после часовой отлучки в хибернейт поднимаются.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #17 Ответы: #46, #53

28. Сообщение от Tron is Whistling (?), 25-Апр-23, 08:47   +/
Вообще сама идея мне честно говоря нравится. Можно перетащить большой долгоживущий процесс с машины на машину и машину обслужить.

Другое дело, что лично мне оно вообще почти не надо, потому что я строго соблюдаю принцип "одна машина - одна задача" + дублирование/кластеризацию, а контейнерщикам со всякими мокросервисами не надо вообще - их проще грохнуть и перезапустить. Но вот когда у тебя есть какая-то махровая проприетарь или щастье, которое ни задублировать, ни погасить на время обслуживания хост-системы, может быть интересно.

Надо с астериском попробовать - кто-нибудь пробовал?

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #56

31. Сообщение от 1 (??), 25-Апр-23, 09:18   +/
Идея хороша, хотя бы для обновления ядра без остановки компа ...
Продумать, чтоб новое ядро перехватывало процессы и вуаля - правильные 24/7
Ответить | Правка | Наверх | Cообщить модератору

32. Сообщение от ZVVZemail (?), 25-Апр-23, 09:35   +3 +/
Что только не делают. лишь бы Plan9/Inferno не пилить
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #42

33. Сообщение от Sw00p aka Jerom (?), 25-Апр-23, 09:36   +/
Лол, Фантому надо было родиться на западе, чтобы эпфийцы заценили его :) как и все остальное давным-давно изобретенное, но не оцененное.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #25

35. Сообщение от Аноним (35), 25-Апр-23, 09:38   +2 +/
Ждем в proxmox для ha lxc контейнеров
Ответить | Правка | Наверх | Cообщить модератору

37. Сообщение от Аноним (37), 25-Апр-23, 10:16   –1 +/
Почему нельзя просто скопировать machine1:/proc/$pid1 на machine2:/proc/$pid2

?

Ответить | Правка | Наверх | Cообщить модератору

40. Сообщение от Ivan (??), 25-Апр-23, 11:16   +1 +/
Жду пока в Proxmox VE добавят живую миграцию LXC контейнеров. Ранее в Promox VE работала живая миграция
OpenVZ контейнеров. После того как разработчики в Proxmox VE добавили LXC вместо OpenVZ, то они сломали живую миграцию контейнеров.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #7 Ответы: #48

41. Сообщение от Ддд (?), 25-Апр-23, 12:04   +1 +/
В демке они игры на лету между датацентрами по планете перекидывали и игра не осианавливалась
Ответить | Правка | Наверх | Cообщить модератору

42. Сообщение от Аноним (16), 25-Апр-23, 13:01   +1 +/
А на них так можно разве?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #32

46. Сообщение от Бывалый смузихлёб (?), 25-Апр-23, 16:31   +/
т.е если подобную штуку запустить и на другом компе, то получится что к одному удалённому источнику установлено 2 одинаковых подключения с разных машин ?

И как тогда они будут одинаковыми, если у новой машины даже адрес будет другой ?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #27 Ответы: #49, #50

48. Сообщение от ABATAPA (ok), 25-Апр-23, 16:40   +/
Для QEMU-контейнеров работает.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #40 Ответы: #54

49. Сообщение от Tron is Whistling (?), 25-Апр-23, 17:37   +/
IP-адрес тоже придётся переносить
А так - да, могут даже смешаться до степени смешения, и будет весело
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #46

50. Сообщение от Tron is Whistling (?), 25-Апр-23, 17:38   +/
Удалённому источнику там пофиг, что у кого установлено, он тупо пакетики получает с энным адресом
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #46

53. Сообщение от Аночик (?), 26-Апр-23, 15:08   –1 +/
В переносе ip адреса как минимум магия.
Ну и так по мелочи.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #27 Ответы: #61

54. Сообщение от PnD (??), 26-Апр-23, 16:23   +/
LXC оборачивает то что умеет ядро с cgropus.
Там некому (пока?) контролировать состояние памяти (чтобы построить поверху миграцию). Максимум что можно — зафризить SIGSTOP и потом тащить всю память, до победного.
Второй проблемой будет перенос состояния CPU в новую точку запуска контейнера. И вот его в CRIU как-то сумели решить, как я понял из новости.
* "Тапки", fd etc. не упоминаю т.к. в целом тривиально.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #48

55. Сообщение от PnD (??), 26-Апр-23, 16:41   +/
> через htop

Сотонист, не иначе.
# pkill -STOP -f XXX
# pkill -CONT -f XXX

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #4

56. Сообщение от PnD (??), 26-Апр-23, 16:55   +/
Э, зачэм астериск? © анекдот про гусей.
Немного не понял смысл упражнения. Не, ну перетащить "прогретую" jvm с одного физ. хоста (без гипервизора-прослойки потому что HFT /а почему тогда java?/ или ещё какая фигня) наверное ок.
Но астер-то зачем вот так???
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #28 Ответы: #62

58. Сообщение от Илья (??), 26-Апр-23, 19:17   +/
> А вейленд такое же нинужгое зло

А есть какой-то другой способ окна рисовать?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #23 Ответы: #60, #63

60. Сообщение от AlexYeCu (ok), 26-Апр-23, 23:59   +/
>А есть какой-то другой способ окна рисовать?

Ты не поверишь…

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #58

61. Сообщение от Tron is Whistling (?), 27-Апр-23, 08:22   +/
А в чём магия-то?
Снял IP на одной системе, поднял на другой.
Или роутинг изменил, а IP на lo.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #53

62. Сообщение от Tron is Whistling (?), 27-Апр-23, 08:26   +/
Это смотря что у вас на астериске.
У нас есть больничные кол-центры, которые даже блин не раскидать по нодам - там столько стейта, что обмениваться этим стейтом между узлами синхронно очково - малейший чих, и звонки встанут. Обновлять хост-систему на таких нодах - очень лютая тема.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #56 Ответы: #64

63. Сообщение от Аноним (63), 27-Апр-23, 08:45   –1 +/
X11, он более универсален, поддерживает сеть, многоголовость (DMX). Хотя и DMX в иксах недавно похерели. Наверно производители железа приплатили.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #58 Ответы: #68

64. Сообщение от PnD (??), 27-Апр-23, 11:59   +1 +/
> У нас есть больничные кол-центры, которые даже блин не раскидать по нодам

Да, "положить" дежурную больницу — отдельная песТня, перед заходом на "посадку".
Я такие штуки прокладывал xen (ну и qemu в DM, как без него). Потому что там легче доказать свою невиноватость. (И такой подход впоследствии отлично зашёл в PCI-DSS.)

Но, т.к. x86-железо (да хотя бы и ARM|Power|etc., протекающему PJSIP [20 байт на входящий по последним замерам] вообще пофиг) в нашей унылой реальности "складывается" примерно всегда. Проектировал так чтобы "сложившийся" узел оборвал текущие звонки. (В этом месте никого не привлекут если все регламенты проведены по журналам.) А новые сразу шли на резерв. Чего и вам желаю.
* Если в системе нет регламента для штатного (без сбоев в обслуживании) вывода из нагрузки, то я даже не знаю что сказать…

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #62

65. Сообщение от Олег (??), 28-Апр-23, 21:33   +/
кеши сделабт много прикольного
уже умеют много прикольного без всяких нововведений
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #26

68. Сообщение от Илья (??), 01-Май-23, 17:34   +/
> X11, он более универсален, поддерживает сеть, многоголовость (DMX). Хотя и DMX в
> иксах недавно похерели. Наверно производители железа приплатили.

Его же усиленно выпиливают и везде рекомендуют от него отказываться.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #63

69. Сообщение от xoyemail (??), 11-Май-23, 21:45   +/
Дела давно минувших лет - преданье старины глубокой.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #22


Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру