Specyfikacje produktu DapuStor J5060
| J5060 | |
|---|---|
| Pojemność (TB) | 61.44 |
| Wskaźnik kształtu | U.2 15 mm |
| Interfejs | PCIe 4.0 x4, NVMe 1.4a, obsługiwane podwójne porty |
| Szerokość pasma odczytu/zapisu (128K) MB/s | 7400 / 3000 |
| Randomne odczytywanie/zapisywanie (4KB) K IOPS | 1500 / 30 (16 KB) |
| 4K Random Latency (Typ.) R/W μs | 105 (4KB) / 33 (16KB) |
| 4K sekwencyjna opóźnienie (typowe) R/W μs | 7 (4KB) / 12 (16KB) |
| Typowa moc (W) | 23 |
| Moc w stanie jałowym (W) | 5 |
| Typ włącza | 3D Enterprise QLC NAND Flash |
| Wytrwałość | 0.5 DWPD |
| MTBF | 2 miliony godzin |
| UBER | 1 sektor na 1017 odczytanych bitów |
| Gwarancja | 5 lat |
DapuStor J5060 Wydajność
Kontrola
Aby ocenić realną wydajność SSD Dapustor J5060 w środowiskach szkoleniowych sztucznej inteligencji, wykorzystaliśmy narzędzie porównawcze Data and Learning Input/Output (DLIO).,DLIO jest specjalnie zaprojektowane do testowania wzorców I/O w obciążeniach roboczych głębokiego uczenia się.i szkolenia modeloweW wykresie poniżej przedstawiono, w jaki sposób oba napędy obsługują proces w 99 punktach kontrolnych.zapobieganie utratom postępu podczas przerw lub awarii zasilaniaTo zapotrzebowanie na magazyny wymaga solidnej wydajności, zwłaszcza w przypadku trwałych lub intensywnych obciążeń roboczych.
Platforma wybrana do tej pracy to Dell PowerEdge R760 z Ubuntu 22.04.02 LTS. Użyliśmy wersji 2.0 DLIO z 13 sierpnia 2024 r. Konfiguracja systemu jest przedstawiona poniżej:
- 2 x Intel Xeon Gold 6430 (32-core, 2,1 GHz)
- 16 x 64 GB DDR5-4400
- 480 GB Dell BOSS SSD
- Kable seryjne Gen5 JBOF
- 61.44TB Dapustor J5060
- 61.44TB Solidigm D5-P5336
W celu zapewnienia, że nasze badanie porównawcze odzwierciedlało rzeczywiste scenariusze, opracowaliśmy nasze testy w oparciu o architekturę modelu LLAMA 3.1 405B. Wdrożyliśmy kontrolę przy użyciu torch.save() do przechwytywania parametrów modelu,stan optymalizatoraNasza konfiguracja symulowała system 8-GPU, wdrażając strategię hybrydowego równoległości z 4-stronnym równoległym tensorem i 2-stronnym równoległym przetwarzaniem rurociągu rozmieszczonym na ośmiu GPU.Ta konfiguracja zaowocowała wielkością punktów kontrolnych wynoszącą 1636 GB, reprezentującą nowoczesne wymagania dotyczące szkolenia dużych modeli językowych.
Ogólnie rzecz biorąc, Dapustor J5060 wykazał solidną spójność podczas początkowej fazy badań, z czasami wahającymi się wokół 575,66 sekundy przez pierwsze 33 punkty kontrolne.5060J był w stanie utrzymać wyższą wydajność przed napędem został napełniony po raz pierwszyZ drugiej strony, Solidigm P5336, choć początkowo wolniejszy od J5060, wykazał stałą wydajność w trakcie testów.
Kiedy?Przy uwzględnieniu ogólnych średnich, Dapustor J5060 odnotował769.44 sekundy, podczas gdy Solidigm P5336 zakończył w 640.17 sekund.To daje Solidigmowi P5336 przewagę pod względem szybszego zaoszczędzenia punktów kontrolnych.
Ogólnie rzecz biorąc, Dapustor J5060 radzi sobie z krótszymi operacjami, ale ma problemy z trwałym pisaniem powyżej 30 minut.Solidigm P5336 jest lepszym napędem dla stałej wydajności podczas długich zadańTa słabsza wydajność zapisu z Dapustora J5060 jest widoczna, gdy jego prędkość kontrolna pogarsza się w miarę trwania testu.
Przechowywanie bezpośrednie GPU
GPU Direct Storage to technologia umożliwiająca bezpośredni transfer danych między urządzeniami pamięci masowej a GPU, pominąc procesor i pamięć systemową.dane są odczytywane z pamięci pamięci w pamięci procesora, a następnie kopiowane do pamięci GPUProces ten obejmuje wiele kopii danych, co prowadzi do zwiększonego opóźnienia i zmniejszonej wydajności.GDS eliminuje ten wąski gardło poprzez bezpośrednie umożliwienie urządzeniom pamięci masowej transferu danych do i z pamięci GPU.
Systematycznie przetestowaliśmy każdą kombinację następujących parametrów zarówno w obciążeniach czytania, jak i zapisu:
- Rozmiary bloków: 1M, 128K, 16K
- Głębokość: 128, 64, 32, 16, 8, 4, 1
W trakcie przeglądu wyników GDSIO, sprawdzamy czytanie i pisanie na Dapustor J5060 i Solidigm P5336 o pojemności 61.44TB.
Wydajność odczytu sekwencyjnego GDSIO
Dapustor J5060 osiąga maksymalną przepustowość odczytu 4,2 GiB/s przy wielkości bloku 1M z głębokością IO 64 i 128.8 GiB/s wraz ze wzrostem głębokości IOWykazuje to wyraźną preferencję dla większych rozmiarów bloków o wysokiej głębokości IO dla optymalnej przepustowości.wskazujący wydajność napędu w obsłudze masowych transferów danych.
Dla porównania, Solidigm P5336 osiągnął podobną maksymalną przepustowość 4.3 GiB/s przy tej samej wielkości bloku (1M), ale osiągnął tę wydajność wcześniej na głębokości IO 32 i utrzymywał ją konsekwentnie na większych głębokościach IOSugeruje to nieco lepszą wydajność w obsłudze dużych wielkości bloków w szerszym zakresie głębokości IO dla Solidigm P5336.
Dla lepszego porównania mamy wykres różnicowy porównujący oba napędy.podczas gdy blok poruszający się w czerwoną stronę widma pokazuje słabośćJ5060 przewyższa P5336 w rozmiarze bloku 128K z wyjątkiem głębokości od 4 do 8 IO.wskazujące na mniejszą efektywność w tych scenariuszach.
W sekwencyjnym porównaniu opóźnienia odczytu, Solidigm P5336 konsekwentnie utrzymuje niższy opóźnienie niż Dapustor J5060 w prawie wszystkich rozmiarach bloków i głębokościach IO.przepaść staje się bardziej wyraźna wraz z wzrostem głębokości kolejki: J5060 osiąga szczyt w temperaturze 2329 μs na głębokości 128 μs, podczas gdy P5336 pozostaje na niższym poziomie w temperaturze 1365 μs.080 μs na J5060 w porównaniu z 5539 μs na P5336) na głębokości 128Przy rozmiarze bloku 1M oba napędy doświadczają wzrostu opóźnienia zgodnie z oczekiwaniami, ale P5336 pozostaje nieco lepiej kontrolowany, z 29,138 μs w porównaniu z 29,512 μs w najwyższej głębokości kolejki.
Wydajność sekwencyjnego zapisu GDSIO
Dapustor J5060 wykazuje stałą przepustowość zapisu od 2,7 do 2,8 GiB/s dla wielkości bloków 128K i 1M we wszystkich głębokościach IO (z wyjątkiem 128K, wielkości głębokości 1 IO, która odnotowała 2,2GiB/s.zakres osiągów od 0.5 GiB/s do 1,4 GiB/s, w zależności od głębokości IO, osiągając szczyt 1,4 GiB/s w większych głębokościach IO.
Dla porównania, Solidigm P5336 działa lepiej w rozmiarach bloków 128K i 1M, osiągając szczyt 3,2 GiB/s. W przypadku mniejszych rozmiarów bloków (16K), Solidigm P5336 wykazuje również wyższą wydajność,osiągając szczyt 1.4 GiB/s w głębokościach IO od 16 do 64. To wskazuje, że Solidigm P5336 jest nieco bardziej wydajny przy mniejszych rozmiarach bloków podczas operacji zapisu.
Przechodząc do widoku różnicowego, widzimy większą lukę otwierającą się między Dapustorem J5060 a wydajnością pisania Solidigm P5336.Nasze porównanie przepustowości pokazuje, że J5060 pozostaje za P5336 w większości obszarów, szczególnie przy dużych rozmiarach bloków (1M) we wszystkich głębokościach IO. Spadki przepustowości osiągają -0,5 GiB/s na głębokościach 4 IO.nie są wystarczająco znaczące, aby zrekompensować ogólną niedoskonałość.
Porównując sekwencyjne opóźnienie zapisu pomiędzy Dapustorem J5060 a Solidigm P5336, oba napędy wykazują podobne zachowanie przy mniejszych rozmiarach bloków, takich jak 16K,Solidigm utrzymuje lekką krawędź na niższych głębokościach IO, podczas gdy Dapustor zamyka lukę na większych głębokościach (64 i 128).ale Dapustor konsekwentnie zapewnia niższą opóźnienie wraz ze wzrostem głębokości IO, co wskazuje na lepszą skalowalność pod obciążeniem. Jednak przy wielkości bloku 1M, Solidigm utrzymuje wyraźną przewagę w zakresie opóźnienia we wszystkich głębokościach IO,wykazujące znacznie szybsze czasy reakcji w przypadku dużych obciążeń sekwencyjnym pisaniaOgólnie rzecz biorąc, Solidigm działa bardziej konsekwentnie, podczas gdy siła Dapustora jest bardziej widoczna w średnich blokach i głębszych kolejkach.
Podsumowanie obciążenia pracą
Flexible I/O Tester (FIO) to standardowe narzędzie porównawcze stosowane w branży do pomiaru wydajności urządzeń pamięci masowej w różnych scenariuszach obciążenia pracą.Zaufanie dla jego wszechstronności i niezawodności, FIO symuluje warunki rzeczywiste, zapewniając wgląd w możliwości i ograniczenia wydajności SSD.,i IOPS w zależności od wzoru obciążenia pracą, wielkości bloków i głębokości kolejki.
Zastosowane obciążenia:
- 128K Sekwencyjne czytanie i pisanie
- 64K przypadkowe czytanie i pisanie
- 16K przypadkowe czytanie i pisanie
- 4K przypadkowe czytanie i pisanie
Obciążenia te reprezentują szerokie spektrum przypadków zastosowania w przedsiębiorstwach, w tym duże sekwencyjne transfery, intensywne przypadkowe I/O typowe dla baz danych,i małych bloków przypadkowych dostępów powszechnie widocznych w wirtualizowanych środowiskach.
Niniejsza sekcja wydajności podsumowuje wydajność Dapustora J5060® w kluczowych obciążeniach syntetycznych, w tym sekwencyjnych i losowych operacjach odczytu/zapisu w różnych rozmiarach bloków i głębokościach kolejek.Wskaźniki są wyciągane bezpośrednio z analizowanego wyjścia sieciowego i obejmują przepustowość (MB/s), IOPS i procenty opóźnienia do 99,9999%, oferując wgląd zarówno w przepustowość, jak i zachowanie ogona pod obciążeniem.
Wydajność odczytu i zapisu 128K
| Wyrzucić | Głębokość nitki/IO | BW (MB/s) | Wpływ | 990,0% | 990,9% | 990,99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Przeczytanie | 1T/64Q | 7,482 | 57,081 | 10,66 ms | 20,02 ms | 20,83 ms |
| Solidigm P5336 Czytanie | 1T/64Q | 7,479 | 57,057 | 1.51 ms | 10,66 ms | 10,81 ms |
| Dapustor J5060 Napisz | 1T/16Q | 3,023 | 23,063 | 00,69 ms | 00,69 ms | 00,70 ms |
| Solidigm P5336 Napisz | 1T/16Q | 3,364 | 25,669 | 20,67 ms | 30,48 ms | 40,42 ms |
Dapustor J5060 oferuje imponującą sekwencyjną wydajność odczytu w rozdzielczości 128K, osiągając 7,48 GB/s przy ścisłej kontroli opóźnienia, nawet w wyższych procentach.Przejście J5060 jest zasadniczo takie samo (7.48GB/s vs. 7.47GB/s). Jednak Solidigm utrzymuje niewielką przewagę w konsekwencji opóźnienia, wykazując nieznacznie niższą opóźnienia ogona.
Przy sekwencyjnym zapisywaniu 128K (QD16) J5060 osiąga solidną wydajność 3,023MB/s przy bardzo niskim opóźnieniu.chociaż o znacznie wyższym opóźnieniuJ5060 jest silniejszym kandydatem do scenariuszy zapisu sekwencyjnego wrażliwych na opóźnienie.
Wydajność czytania i zapisywania 64K
| Wyrzucić | Głębokość | BW (MB/s) | Wpływ | 990,0% | 990,9% | 990,99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Czytaj | 8T/32Q | 7,475 | 114,058 | 200,05 ms | 210,89 ms | 250,82 ms |
| Solidigm P5336 Czytanie | 8T/32Q | 7,472 | 114,014 | 210,36 ms | 210,89 ms | 220,68 ms |
| Dapustor J5060 Napisz | 8T/32Q | 534 | 8,151 | 5740,6 ms | 7080,8 ms | 742.39 ms |
| Solidigm P5336 Napisz | 8T/32Q | 857 | 13,070 | 196.1 ms | 2080,6 ms | 221.24 ms |
W przypadkowych odczytach 64K (QD256), Dapustor J5060 wyróżnia się przepustowością blisko 7,4 GB / s i dobrze kontrolowaną opóźnieniem.z nieco lepszą maksymalną latencją procentowąObie napędy działają wyjątkowo, z minimalnymi praktycznymi różnicami.
Wydajność zapisu w 64K random jest miejscem, w którym J5060 zauważalnie zmaga się z problemami, przy czym przepustowość gwałtownie spada do 534MB/s, a opóźnienie znacznie rośnie (742,39ms przy 99,99%).Solidigm P5336 znacznie przewyższa J5060, zapewniający 857 MB/s i znacznie niższą opóźnienie (221,24 ms w tym samym procentilu), co czyni go znacznie bardziej odpowiednim dla aplikacji wrażliwych na opóźnienie i trwałą przepustowość zapisu.
16K Random Reading and Writing Performance (Wykonanie czytania i pisania w sposób losowy)
| Wyrzucić | Głębokość | BW (MB/s) | Wpływ | 990,0% | 990,9% | 990,99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Czytaj | 8T/32Q | 7,430 | 453,461 | 5.28 ms | 6.39 ms | 8.16 ms |
| Solidigm P5336 Czytanie | 8T/32Q | 7,431 | 453,527 | 50,01 ms | 5.21 ms | 50,47 ms |
| Dapustor J5060 Napisz | 8T/32Q | 531 | 32,404 | 1430,65 ms | 1490,94 ms | 1810,40 ms |
| Solidigm P5336 Napisz | 8T/32Q | 847 | 51,724 | 570,9 ms | 650,8 ms | 710,8 ms |
Przy 16K przypadkowym obciążeniu odczytu (QD256) Dapustor osiąga doskonałe wyniki z 453K IOPS i kontrolowanym opóźnieniem.nieznacznie wyprzedzając Dapustora w czasie opóźnienia (50,47 ms w porównaniu z 8,16 ms przy 99,99%), co sugeruje nieco lepszą spójność opóźnienia dla Solidigm w ciężkich przypadkowych scenariuszach odczytu.
Wydajność zapisu losowego 16K Dapustora spadła znacznie do 32K IOPS, a opóźnienie wzrosło do 181,4 ms (99,99%).dostarczanie 51.7K IOPS i znacząco poprawiony profil opóźnienia (71,8 ms przy 99,99%), podkreślając przewagę Solidigm'a w przypadku czułych na opóźnienie ładunków pracy wpisów losowych.
Pekin Qianxing Jietong Technology Co., Ltd.
Sandy Yang, dyrektor ds. strategii globalnej
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Strona internetowa: www.qianxingdata.com/www.storagesserver.com
Skoncentruj się na biznesie:
Dystrybucja produktów ICT/Integracja systemów i usługi/Rozwiązania infrastrukturalne
Dzięki ponad 20-letniemu doświadczeniu w dystrybucji IT współpracujemy z wiodącymi światowymi markami w celu dostarczania niezawodnych produktów i profesjonalnych usług.
Używanie technologii do budowy inteligentnego świata•Twój zaufany dostawca usług produktów ICT!



