Inne uzasadnienie
:
W grudniu 2023 roku ACK Cyfronet AGH uruchomiło superkomputer Helios dostarczony przez Hewlett Packard Enterprise Polska sp. z o.o., który został nabyty w drodze postępowania przetargowego ACK- DA-ZP-5000-1/23 za kwotę 85 000 000,00 PLN. W 2025 roku MNiSW przyznało Cyfronetowi dotację inwestycyjną, która zgodnie z wnioskiem, ma zostać przeznaczona na rozbudowę zasobów obliczeniowych Cyfronetu. Najbardziej efektywną metodą realizacji tych założeń jest nabycie dodatkowych serwerów obliczeniowych, które zostaną włączone w infrastrukturę systemu Helios. Takie rozwiązanie jest efektywne kosztowo, gdyż pozwala uniknąć duplikowania niektórych elementów infrastruktury (np. sieciowej czy współdzielenia danych) i jednocześnie umożliwi skuteczne wykorzystanie usług powstałych z wykorzystaniem dodatkowych serwerów przez istniejących użytkowników Cyfronetu. W praktyce taka rozbudowa polegać będzie na zakupieniu ok. 20 szt. dodatkowych modułów blade z 80 serwerami obliczeniowymi, które zostaną umieszczone w jednej z istniejących szaf obliczeniowych Heliosa. Konfiguracja serwerów jaka jest potrzebna do osiągnięcia założonych celów to ok. 80 niezależnych maszyn, każda wyposażona w 192 rdzenie obliczeniowe, 768 GB pamięci RAM oraz szybki interfejs sieciowy wspierający komunikację o niskich opóźnieniach (ang. low-latency). Dokładnie taka jest konfiguracja serwerów Heliosa typu CPU-B, których obecnie jest w tym systemie 160 sztuk w 40 modułach blade HPE Cray EX4252. Jedynym wykonawcą jaki może zrealizować dostawę dodatkowych serwerów jest Hewlett Packard Enterprise Polska sp. z o.o.. Wynika to z faktu, że Helios jest wysoce specjalizowaną instalacją superkomputerową opartą o platformę HPE Cray EX4000, której jedynym producentem jest korporacja Hewlett Packard Enterprise. Wysoka efektywność energetyczna oraz parametry techniczne rozwiązania zostały zweryfikowane w prowadzonym w ubiegłym roku postępowaniu przetargowym, w którym to rozwiązanie zostało ocenione najwyżej spośród 3 ofert. O wysokiej złożoności tego rozwiązania świadczy fakt, że obecnie w pierwszej dziesiątki najszybszych superkomputerów (wg. listy Top500) na świecie aż sześć, w tym trzy pierwsze, oparte są o tę platformę. Złożoność techniczna instalacji tej maszyny jest tak wysoka, że w przypadku Heliosa bezpośrednim wykonawcą była sama Hewlett Packard Enterprise Polska sp. z o.o., a nie jak to zwykle ma miejsce w przypadku dostaw serwerów, jeden z partnerów handlowych spółki. W Polsce istnieje obecnie tylko jedna instalacja oparta o platformę HPE Cray EX4000 i jest to właśnie Helios. Wyjątkowość platformy HPE Cray EX4000 polega zarówno na bardzo wysokiej gęstości upakowania systemu dzięki zastosowaniu specjalnego formatu serwerów (tzw. blade) z bezpośrednim chłodzeniem cieczą jak i unikalnej sieci połączeniowej Slingshot-11. Wyłącznym producentem obu tych rozwiązań jest HPE i nie istnieją żadni inni producenci rozwiązań kompatybilnych, które umożliwiałyby instalację produktu firmy trzeciej w szafie Cray EX4000. Rozwiązania innych producentów będą niekompatybilne z posiadaną instalacją, a więc ich instalacja w istniejącej infrastrukturze jest niemożliwa, zarówno na poziomie logicznym (np. sieć) jak i fizycznym (obudowy). Jedynym możliwym wyborem są w tym przypadku moduły blade HPE Cray EX4252, które gwarantują pełną kompatybilność z posiadaną infrastrukturą na każdym możliwym poziomie, od zgodności fizycznej i elektrycznej przez logiczną (sieci, moduły zarządzania) aż po spójny system serwisowy. Włączenie dodatkowych serwerów do infrastruktury będzie mogło odbyć się bezprzerwowo dla pracy Heliosa, obecnie najszybszego superkomputera w Polsce, pracującego w trybie 24/7. Podsumowując, zważając na unikalność technologiczną oraz wartość superkomputera Helios, jego rozbudowa o dodatkowe serwery obliczeniowe możliwa jest wyłącznie w oparciu o komponenty HPE Cray, których jednym producentem jest korporacja HPE, której jedyną jednostką jaka ma wewnętrzne kompetencje i uprawnienia do sprzedaży i instalacji produktów HPE Cray EX4000 jest Hewlett Packard Enterprise Polska sp. z o.o. Helios zostanie również rozbudowany o dodatkowe serwery obliczeniowe z kartami GPGU. Zakupione zostaną 3 serwery, każdy wyposażony w 8 kart Nvidia RTX PRO 6000 96GB. Serwery będą stanowić integralną część superkomputera, jako rozbudowa posiadanej już partycji z 24 kartami H100 wraz z procesorami o architekturze typu x86. Ze względu na przeznaczenie tych serwerów do treningu i inferencji w obliczeniach AI oraz konieczność wydajnego transferowania danych treningowych z systemu składowania danych do kart GPGPU i niezbędną, wydajną komunikację z serwerami obliczeniowymi umieszczonymi w szafach HPE Cray, wymagana jest wspierana przez producenta integracja za pomocą sieci Slingshot. Jedynym dostawcą spełniającym kryteria tak skomplikowanego środowiska obliczeniowego wraz z niezbędnym wsparciem technicznym i gwarancyjnym pozostaje firma HPE.