zestaw Raspberry Pi AI

Zestaw Raspberry Pi AI działa poprzez podłączenie dedykowanej jednostki przetwarzania neuronowego poprzez adapter M.2 HAT+ do interfejsu PCIe Raspberry Pi 5. Zestaw zapewnia 13 tera-operacji na sekundę mocy obliczeniowej AI za jedyne 70 USD, umożliwiając wykrywanie obiektów w czasie rzeczywistym, szacowanie pozycji i segmentację obrazu bez obciążania głównego procesora. Ten samodzielny moduł akceleracji obsługuje lokalnie wnioskowanie AI, dzięki czemu Twój Pi 5 może uruchamiać zaawansowane modele widzenia komputerowego, które wcześniej wymagały przetwarzania w chmurze lub drogiego sprzętu.

Wyczucie rynku jest istotne. Raspberry Pi odnotowało przychody w wysokości 259,5 mln dolarów za rok budżetowy 2024 dzięki wprowadzeniu 22 produktów skupiających się na sprzęcie AI i IoT, co sygnalizuje strategiczne położenie firmy na przetwarzaniu brzegowym. W miarę jak firmy przenoszą obciążenia AI z chmury na urządzenia brzegowe, zrozumienie sposobu działania tego niedrogiego zestawu staje się kluczowe dla programistów pracujących nad inteligentnymi kamerami, robotyką i projektami automatyki przemysłowej.

Zestaw AI składa się z trzech zintegrowanych komponentów, które współpracują ze sobą. Procesor neuronowy Hailo-8L znajduje się w rdzeniu – to tam odbywają się rzeczywiste obliczenia AI. Moduł wykorzystuje obudowę M.2 2242 i łączy się poprzez złącze krawędziowe M z wpustem, zgodnie ze standardowymi konwencjami komponentów komputerów PC.

M.2 HAT+ służy jako pomost pomiędzy chipem Hailo a interfejsem PCIe Gen 3 Raspberry Pi. Pomyśl o tym jak o tłumaczu, który konwertuje sygnały między dwoma różnymi językami sprzętowymi. Podkładka termiczna jest fabrycznie-zamontowana pomiędzy modułem a HAT+, aby zapobiec przegrzaniu podczas intensywnych operacji AI.-Ten szczegół ma znaczenie, ponieważ przetwarzanie neuronowe generuje znaczne ciepło.

Sekwencja połączeń wygląda następująco: Raspberry Pi 5 → kabel PCIe FPC → M.2 HAT+ → chip Hailo-8L. W przeciwieństwie do nowszej wersji AI HAT+, która integruje wszystko na jednej płycie, zestaw AI wykorzystuje modułowe podejście M.2, co zapewnia elastyczność potencjalnej wymiany pamięci NVMe, jeśli zajdzie taka potrzeba.

Liczby surowe TOPS nie opowiadają pełnej historii. Hailo-8L osiąga wydajność 3–4 TOPS na wat, co wyjaśnia, dlaczego działa porównywalnie z systemami kosztującymi 5 razy więcej. Testy w świecie rzeczywistym ujawniają więcej praktycznych spostrzeżeń.

Dzięki wykrywaniu obiektów YOLOv8 na kanale wideo o rozdzielczości 640 x 640 pikseli, Pi 5 z Hailo-8L osiąga 80 klatek na sekundę z włączoną obsługą PCIe Gen 3, co dwukrotnie przewyższa wydajność w trybie Gen 2. Zużycie energii pozostaje wyjątkowo niskie. Cały system Pi 5 8GB z akceleracją Hailo pobiera około 10 W podczas aktywnego wnioskowania AI, co jest porównywalne z typową ładowarką do telefonu.

Zarządzanie temperaturą sprawdza się w praktyce. Testy porównawcze Seeed Studio wykazały stabilną wydajność podczas długich sesji bez ograniczania wydajności, dzięki-preinstalowanemu rozwiązaniu termicznemu. Kontrastuje to z wnioskowaniem opartym- na GPU, gdzie ograniczenia termiczne często stają się wąskim gardłem.

Oto, co faktycznie się dzieje, gdy Twój Pi 5 przetwarza wideo na żywo za pomocą zestawu AI. Moduł kamery przechwytuje klatki i wysyła surowe dane obrazu do procesora Raspberry Pi poprzez interfejs CSI. Procesor wykonuje minimalne przetwarzanie wstępne,-zazwyczaj jedynie konwersję formatu i dostosowanie rozdzielczości-przed przekazaniem danych do akceleratora Hailo.

raspberry pi ai kit

Magistrala PCIe Gen 3 przesyła te wstępnie przetworzone dane do Hailo-8L z prędkością do 8 GT/s. Następnie procesor neuronowy przeprowadza faktyczne wnioskowanie, korzystając ze swojej wyspecjalizowanej architektury. Architektura Hailo-8 obejmuje niezależną pamięć RAM bez konieczności stosowania zewnętrznej pamięci DRAM, co radykalnie zmniejsza opóźnienia w porównaniu z tradycyjnymi akceleratorami AI, które stale pobierają dane z pamięci systemowej.

Wyniki przesyłane są z powrotem przez to samo połączenie PCIe. Procesor otrzymuje dane strukturalne,-współrzędne obiektów, wskaźniki pewności klasyfikacji, wykryte pozy,-a nie surowe piksele. Twój skrypt Pythona następnie interpretuje te wyniki, aby wywołać działania: wysłać alert, nagrać materiał, aktywować silniki lub zaktualizować bazę danych.

Stos oprogramowania rpicam-apps zapewnia warstwę integracji. Obecnie rpicam-apps to podstawowe oprogramowanie z głęboką integracją z Hailo, chociaż dodano obsługę Picamera2. Oznacza to, że możesz pisać skrypty, które płynnie przesyłają sygnał wejściowy z kamery przez sieci neuronowe za pomocą zaledwie kilku linijek kodu.

Pozwólcie, że omówię konkretny przykład demonstrujący możliwości zestawu. W ramach projektu VEEB Projects zbudowano „Peeper Pam” – system wykrywania-oparty na sztucznej inteligencji, który ostrzega użytkowników, gdy podczas rozmów wideo ktoś zbliża się od tyłu, wykorzystując wykrywanie obiektów do identyfikacji ludzi, ignorując meble i rośliny.

Do ich realizacji potrzebne były podstawowe komponenty: Raspberry Pi 5 z zestawem AI, moduł kamery 3, Raspberry Pi Pico W i woltomierz analogowy. Opracowanie systemu zajęło zaledwie trzy dni, a największym wyzwaniem technicznym było wdrożenie gniazd internetowych zapewniających efektywną komunikację między Pi 5 i Pico W.

Architektura demonstruje inteligentne przetwarzanie brzegowe. Pi 5 obsługuje lokalnie całe przetwarzanie sztucznej inteligencji,-analizując każdą klatkę pod kątem obecności człowieka, obliczając wskaźniki pewności i wyzwalając alerty. Lekki Pico W po prostu nasłuchuje sygnałów, zamiast stale odpytywać, oszczędzając energię i zmniejszając obciążenie sieci. Miernik analogowy zapewnia natychmiastową wizualną informację zwrotną, przechodzącą od 0 (nie wykryto żadnej osoby) do 1 (pewne wykrycie) ze stopniowaniem niepewności.

Projekt ten pochłonął łącznie około 12-15 W mocy, łącznie z kamerą, czyli znacznie mniej niż porównywalne rozwiązania oparte na chmurze, które wymagałyby ciągłego przesyłania strumieniowego wideo. Lokalne przetwarzanie wyeliminowało również obawy dotyczące prywatności, ponieważ żaden materiał filmowy nie opuszcza urządzenia.

Uruchomienie zestawu AI obejmuje pięć odrębnych faz. Każda faza ma specyficzne wymagania i typowe pułapki, których należy unikać.

Faza 1: Montaż sprzętu

Zacznij od Raspberry Pi 5 z najnowszym 64-bitowym systemem operacyjnym Raspberry Pi. Podłącz nakładkę M.2 HAT+ do złącza GPIO, zapewniając odpowiednie wyrównanie. Podłącz kabel PCIe FPC zarówno do Pi, jak i do HAT.+-Kabel ma określoną orientację, a niewłaściwe naciśnięcie go na siłę spowoduje uszkodzenie złącza. Zamocuj moduł Hailo-8L w gnieździe M.2 za pomocą dołączonej podkładki.

Faza 2: Włącz PCIe Gen 3

Aby zapewnić stabilność, Pi 5 domyślnie korzysta z PCIe Gen 2. Edytuj plik /boot/firmware/config.txt i dodaj dtparam=pciex1_gen=3. Ta pojedyncza zmiana podwaja wydajność wnioskowania. Uruchom ponownie i sprawdź za pomocą lspci -vv|grep „LnkSta:”, aby potwierdzić aktywność Gen 3.

Faza 3: Instalacja oprogramowania

Zainstaluj stos oprogramowania Hailo: sudo apt update i sudo apt install hailo-all. Ten pakiet zawiera środowisko wykonawcze HailoRT, aplikacje rpicam-z obsługą Hailo i przykładowe modele sieci neuronowych. Instalacja wymaga około 2 GB miejsca na dysku i 10-15 minut przy typowym połączeniu szerokopasmowym.

Faza 4: Testy weryfikacyjne

Uruchom dołączone demo wykrywania obiektów: rpicam-hello -t 0 --post-process-file /usr/share/rpi-camera-assets/hailo_yolov6_inference.json. Powinieneś zobaczyć wykrywanie obiektów-w czasie rzeczywistym z ramkami ograniczającymi narysowanymi wokół wykrytych elementów. Liczba klatek na sekundę powyżej 60 FPS wskazuje na prawidłowe działanie Gen 3.

Faza 5: Wdrożenie modelu niestandardowego

W przypadku własnych przeszkolonych modeli użyj kompilatora Hailo Dataflow Compiler, aby przekonwertować modele TensorFlow lub PyTorch na format HEF Hailo. Kompilator automatycznie obsługuje kwantyzację i optymalizację, chociaż do kalibracji potrzebne będą reprezentatywne próbki zestawu danych. Wdróż powstały plik .hef i zintegruj go z potokiem aplikacji rpicam-.

Rynek chipów Edge AI odnotowuje gwałtowny wzrost. Globalny rynek chipów AI osiągnął 123,16 miliardów dolarów w 2024 r., a przewiduje się, że do 2029 r. osiągnie 311,58 miliardów dolarów, co oznacza wzrost CAGR na poziomie 24,4%. Nie chodzi tu tylko o większe liczby,-jest to fundamentalna zmiana w sposobie przetwarzania AI.

Hailo, firma odpowiedzialna za chip przyspieszający, uzyskała znaczącą weryfikację. Startup zebrał 120 milionów dolarów w kwietniu 2024 roku i obecnie obsługuje ponad 300 klientów z sektorów motoryzacji, bezpieczeństwa, handlu detalicznego i automatyki przemysłowej. Ich przetrwanie na rynku, na którym upadło wiele start-upów zajmujących się chipami AI, świadczy o rentowności rozwiązań-skoncentrowanych na krawędziach.

raspberry pi ai kit

Konkurencyjny krajobraz podkreśla interesujące kompromisy. Hailo-10H zapewnia 40 TOPS wydajności INT4, co odpowiada 20 TOPS wydajności INT8, w porównaniu do Intel Core Ultra Meteor Lake NPU przy 11 TOPS i AMD Ryzen 8040 przy 16 TOPS. Jednak od stycznia do września 2023 r. amerykańskie firmy produkujące chipy zebrały zaledwie 881 mln dolarów, w porównaniu z 1,79 mld dolarów w 2022 r., co pokazuje wymagające środowisko finansowania, które sprawia, że sukces Hailo jest znaczący.

Przewiduje się, że w szczególności w przypadku ekosystemu Raspberry Pi skupienie się na sztucznej inteligencji i IoT doprowadzi do 15-20%-rocznego-wzrostu sprzedaży akcesoriów do roku 2026. Zestaw AI reprezentuje wejście Raspberry Pi na rynek, na którym może ona wykorzystać swoją ogromną bazę użytkowników i sieć dystrybucji w walce z wyspecjalizowaną konkurencją.

Błędne przekonanie: „13 TOPS oznacza, że obsługuje dowolny model AI”

Rzeczywistość zawiera istotne niuanse. Hailo-8L doskonale sprawdza się w splotowych sieciach neuronowych do komputerowego wykrywania obiektów wizyjnych, segmentacji i szacowania pozycji. Ma problemy z dużymi modelami językowymi, ponieważ w chipie brakuje wystarczającej ilości pamięci VRAM do wnioskowania LLM. Liczba 13 TOPS dotyczy operacji INT8, podczas gdy wiele modeli transformatorów oczekuje precyzji FP16 lub FP32.

Błędne przekonanie: „To po prostu szybszy procesor graficzny”

Akceleratory neuronowe wykorzystują zasadniczo różne architektury. Procesory graficzne korzystają z ogólnego-projektu przetwarzania równoległego, dzięki czemu są elastyczne, ale mniej wydajne. Architektura przepływu danych Hailo-8 wykorzystuje w szczególności właściwości sieci neuronowej, eliminując zależność od zewnętrznej pamięci DRAM. Ta specjalizacja zapewnia 20 razy lepszą efektywność energetyczną w przypadku określonych zadań niż rozwiązania GPU, ale oznacza także mniejszą elastyczność w przypadku obciążeń innych niż sztuczna inteligencja.

Błędne przekonanie: „Podłącz-i-korzystaj z dowolnej kamery”

Chociaż zestaw obsługuje wiele kamer, integracja wymaga specjalnego wsparcia oprogramowania. Początkowo tylko aplikacje rpicam-oferowały głęboką integrację z Hailo, chociaż obsługa Picamera2 pojawiła się później. Kamery internetowe USB działają, ale wymagają innych ścieżek kodowych. Kamery MIPI CSI zapewniają najściślejszą integrację, ale należy sprawdzić kompatybilność z konkretnym modelem kamery.

Błędne przekonanie: „Większy rozmiar partii zawsze oznacza lepszą wydajność”

Testowanie ujawnia interesujące ograniczenie. Wydajność poprawia się od partii o rozmiarze 2 (80 FPS) do partii o rozmiarze 8 (120 FPS), ale spada do 100 FPS przy partii o rozmiarze 16 z powodu ograniczeń przepustowości PCIe. Sugeruje to, że interfejs PCIe Gen 3 x1 Pi 5 staje się wąskim gardłem w przypadku większych partii, a nie sam procesor neuronowy.

Nieskutecznie w obecnej formie. Hailo-8L nie ma wystarczającej pojemności pamięci dla modeli o dużych językach, które zazwyczaj wymagają 4–16 GB dedykowanej pamięci RAM tylko ze względu na wagę modelu. Jednakże mniejsze modele skwantowane o parametrach 1B mogą działać ze znacznymi ograniczeniami wydajności. Projekt rozproszonej Llamy demonstruje działanie LLaMA 3 8B na czterech jednostkach Pi 4 z szybkością 1,6 tokenów na sekundę, chociaż nie wykorzystuje to akceleracji zestawu AI.

Zestaw AI wykorzystuje moduł M.2, który można podłączyć do płytki adaptera M.2 HAT+. AI HAT+ integruje chip Hailo bezpośrednio z pełną płytką HAT i jest dostępny w 13 wariantach TOPS (70 USD) i 26 TOPS (110 USD). Wersja 26 TOPS wykorzystuje Hailo-8 zamiast Hailo-8L. Obydwa korzystają z identycznego oprogramowania i bibliotek, więc wybór między nimi zależy od tego, czy potrzebujesz gniazda M.2 do innych celów.

Dramatycznie niższe. Kompletny system Pi 5 z aktywnym wnioskowaniem AI pobiera około 10 W, czyli około 240 Wh dziennie, jeśli działa nieprzerwanie. Wnioskowanie w chmurze wymagałoby ciągłego przesyłania strumieniowego wideo (przesyłanie z szybkością 2–4 Mb/s) oraz wywołań API do przetwarzania, co zazwyczaj wiązałoby się z większymi kosztami przepustowości i energią w centrum danych. W przypadku aplikacji z kamerą monitorującą działającą całą dobę, 7 dni w tygodniu, przetwarzanie lokalne może zaoszczędzić 20–40 USD miesięcznie na opłatach za przepustowość i interfejs API w chmurze.

Nie bezpośrednio na pojedynczym Pi 5, który ma tylko jeden interfejs PCIe. Jednak Jeff Geerling zademonstrował połączenie wielu akceleratorów za pomocą przełączników PCIe i kart rozszerzeń, uzyskując łącznie 51 TOPS na różnych chipach Hailo i Coral, chociaż ta konfiguracja nie jest oficjalnie obsługiwana i wymaga zewnętrznych zasilaczy.

Zależy to od złożoności modelu i rozdzielczości wejściowej. YOLOv8 przy rozdzielczości 640 x 640 osiąga 80-120 FPS w zależności od wielkości partii. Prostsze modele, takie jak MobileNet, mogą osiągnąć 200+ FPS. Cięższe modele, takie jak YOLOv8x, mogą spaść do 30-40 FPS. Dla porównania, ludzki wzrok płynnie rejestruje ruch przy 24–30 klatkach na sekundę, więc większość aplikacji czasu rzeczywistego oferuje wygodny zapas wydajności.

Faza szkolenia odbywa się na komputerze stacjonarnym lub w chmurze przy użyciu standardowych przepływów pracy TensorFlow lub PyTorch-chip Hailo nie uczestniczy w szkoleniu. Proces konwersji wymaga nauki kompilatora Hailo Dataflow Compiler, który wymaga nauki, ale zawiera obszerną dokumentację. Jeśli znasz już szkolenie w zakresie sieci neuronowych, poczekaj 2–3 dni na uruchomienie pierwszego modelu niestandardowego. Kompilator automatycznie obsługuje kwantyzację, chociaż będziesz potrzebować reprezentatywnego zestawu danych kalibracyjnych.

Zestaw AI jest specjalnie przeznaczony dla interfejsu PCIe i kształtu Raspberry Pi 5. Jednak podstawowy moduł Hailo-8L M.2 jest komponentem standardowym. Urządzenia takie jak reComputer R1000 firmy Seeed Studio z gniazdami M.2 mogą pomieścić moduł Hailo, chociaż konieczne będzie przeniesienie stosu oprogramowania. Inne karty SBC z gniazdami M.2 (Rock 5B, Orange Pi 5) teoretycznie mogłyby działać, ale wymagałyby znacznego wysiłku związanego z integracją oprogramowania.

Społeczność stworzyła różnorodne aplikacje. Projekty obejmują inteligentne dozowniki pigułek wykorzystujące rozpoznawanie obiektów, kamery dzikiej przyrody z identyfikacją gatunków oraz alerty na zaśmieconym biurku, które liczą obiekty. Oszacowanie pozycji umożliwia aplikacjom śledzącym kondycję, które monitorują formę ćwiczeń i liczą powtórzenia. Użytkownicy przemysłowi wdrażają ten zestaw do kontroli jakości, liczenia produktów na przenośnikach taśmowych i wykrywania naruszeń bezpieczeństwa w-transmisjach wideo w czasie rzeczywistym.

Zestaw Raspberry Pi AI błyszczy w określonych scenariuszach. Jest to idealne rozwiązanie, gdy potrzebujesz wizji komputerowej w czasie rzeczywistym{{1}na zasilaniu bateryjnym lub w środowiskach wbudowanych, w których łączność z chmurą jest zawodna. Inteligentne dzwonki do drzwi, kamery przyrodnicze, systemy inspekcji przemysłowej i aplikacje robotyki stanowią idealny-zadania wymagające ciągłego przetwarzania sztucznej inteligencji przy małych wymaganiach dotyczących opóźnień i budżetów mocy.

Rozważ alternatywy, jeśli Twoje wymagania są różne. Jeśli interesują Cię przede wszystkim programy LLM lub przetwarzanie języka naturalnego, będziesz potrzebować innego sprzętu,-być może procesora graficznego do komputerów stacjonarnych lub dostępu do API w chmurze. W przypadku sporadycznych zadań związanych ze sztuczną inteligencją, gdzie opóźnienie nie jest krytyczne, usługi w chmurze mogą okazać się-tańsze pomimo wyższych kosztów-wnioskowania.

Cena 70 dolarów pozycjonuje zestaw jako platformę eksperymentalną, wystarczająco przystępną cenowo do nauki, a jednocześnie wystarczająco potężną do prototypów produkcyjnych. Dzięki strategicznemu naciskowi Raspberry Pi na możliwości sztucznej inteligencji i wprowadzeniu na rynek 22 produktów w 2024 r. ekosystem oprogramowania będzie nadal dojrzewał, co z czasem sprawi, że inwestycja stanie się bardziej wartościowa.

Zabudżetuj dodatkowe 100-150 USD na komponenty pomocnicze: wysokiej jakości zasilacz, moduł kamery, obudowę z chłodzeniem i kartę microSD o wystarczającej klasie szybkości. Całkowity koszt systemu wynoszący 200–250 USD nadal jest niższy od komercyjnych systemów kamer AI o 50–70%, oferując jednocześnie pełną swobodę dostosowywania.

Trajektoria rynku brzegowej sztucznej inteligencji sugeruje, że teraz jest strategiczny czas na rozwijanie umiejętności za pomocą tych narzędzi. Niezależnie od tego, czy jesteś studentem badającym możliwości kariery, twórcą prototypów produktów, czy inżynierem oceniającym technologie do zastosowań przemysłowych, zrozumienie sposobu działania zestawu Raspberry Pi AI Kit zapewnia praktyczne-doświadczenie w zakresie architektur komputerowych, które będą zasilać inteligentne urządzenia przez następną dekadę.

zestaw Raspberry Pi AI

Jak działa zestaw Raspberry Pi AI?

Wewnątrz sprzętu: architektura fizyczna

Metryki wydajności, które naprawdę mają znaczenie

Przepływ danych: od kamery do wyników wnioskowania

Wdrożenie w prawdziwym-świecie: futerał na inteligentną kamerę monitorującą

Krok-po-Proces konfiguracji

Kontekst rynkowy: dlaczego przyspieszenie Edge AI ma teraz znaczenie

Typowe błędne przekonania na temat zestawu AI

Często zadawane pytania

Czy zestaw AI może obsługiwać ChatGPT lub podobne LLM?

Jaka jest różnica między AI Kit a AI HAT+?

Jak zużycie energii wypada w porównaniu z wnioskowaniem w chmurze?

Czy mogę używać wielu zestawów AI na jednym Raspberry Pi 5?

Jakiej szybkości klatek powinienem się spodziewać w przypadku-aplikacji czasu rzeczywistego?

Jak trudno jest trenować niestandardowe modele?

Czy to działa z innymi komputerami jedno-płytowymi?

Jakie projekty tak naprawdę realizują ludzie?

Podejmowanie decyzji: kiedy zestaw AI ma sens