DeepSeek-R1 ผสมผสาน AI และ Edge Computing สำหรับ IoT ในอุตสาหกรรม

การแนะนำ

โมเดลที่กลั่นขนาดเล็กของ DeepSeek-R1 ได้รับการปรับแต่งอย่างละเอียดโดยใช้ข้อมูลห่วงโซ่ความคิดที่สร้างขึ้นโดย DeepSeek-R1 ซึ่งทำเครื่องหมายด้วย-แท็กที่สืบทอดความสามารถในการใช้เหตุผลของ R1 ชุดข้อมูลที่ปรับแต่งอย่างละเอียดเหล่านี้รวมถึงกระบวนการใช้เหตุผล เช่น การแยกย่อยปัญหาและการอนุมานระดับกลาง การเรียนรู้การเสริมแรงได้ปรับรูปแบบพฤติกรรมของแบบจำลองที่กลั่นแล้วให้สอดคล้องกับขั้นตอนการใช้เหตุผลที่สร้างขึ้นโดย R1 กลไกการกลั่นนี้ช่วยให้แบบจำลองขนาดเล็กรักษาประสิทธิภาพในการคำนวณได้ในขณะที่ได้รับความสามารถในการใช้เหตุผลที่ซับซ้อนใกล้เคียงกับแบบจำลองขนาดใหญ่ ซึ่งมีมูลค่าการใช้งานที่สำคัญในสถานการณ์ที่มีทรัพยากรจำกัด ตัวอย่างเช่น เวอร์ชัน 14B บรรลุผลสำเร็จของโค้ด 92% ของแบบจำลอง DeepSeek-R1 ดั้งเดิม บทความนี้จะแนะนำแบบจำลองที่กลั่นแล้ว DeepSeek-R1 และแอปพลิเคชันหลักในการประมวลผลแบบเอจระดับอุตสาหกรรม ซึ่งสรุปไว้ในสี่ทิศทางต่อไปนี้ พร้อมด้วยกรณีการใช้งานเฉพาะ:

dc3c637c5bead8b62ed51b6d83ac0b4

การบำรุงรักษาอุปกรณ์เชิงคาดการณ์

การดำเนินการทางเทคนิค

ฟิวชั่นเซ็นเซอร์:

รวมการสั่นสะเทือน อุณหภูมิ และข้อมูลกระแสไฟฟ้าจาก PLC ผ่านทางโปรโตคอล Modbus (อัตราการสุ่มตัวอย่าง 1 kHz)

การสกัดคุณลักษณะ:

เรียกใช้ Edge Impulse บน Jetson Orin NX เพื่อแยกฟีเจอร์ไทม์ซีรีส์ 128 มิติ

แบบจำลองการอนุมาน:

ใช้งานโมเดล DeepSeek-R1-Distill-14B โดยป้อนเวกเตอร์ฟีเจอร์เพื่อสร้างค่าความน่าจะเป็นของความผิดพลาด

การปรับไดนามิก:

ทริกเกอร์คำสั่งงานการบำรุงรักษาเมื่อความเชื่อมั่น > 85% และเริ่มกระบวนการตรวจสอบรองเมื่อ < 60%

กรณีที่เกี่ยวข้อง

Schneider Electric นำโซลูชันนี้ไปใช้กับเครื่องจักรในการทำเหมืองแร่ ซึ่งช่วยลดอัตราการเกิดผลบวกปลอมลง 63% และลดต้นทุนการบำรุงรักษาลง 41%

1

การรัน DeepSeek R1 Distilled Model บนคอมพิวเตอร์ InHand AI Edge

การตรวจสอบภาพที่ได้รับการปรับปรุง

สถาปัตยกรรมเอาท์พุต

ไปป์ไลน์การปรับใช้โดยทั่วไป:

กล้อง = GigE_Vision_Camera(500fps) # กล้องอุตสาหกรรมกิกะบิต
frame = camera.capture() # จับภาพ
preprocessed = OpenCV.denoise(frame) # การประมวลผลล่วงหน้าเพื่อขจัดเสียงรบกวน
defect_type = DeepSeek_R1_7B.infer(preprocessed) # การจำแนกประเภทข้อบกพร่อง
ถ้า defect_type != 'ปกติ':
PLC.trigger_reject() # กลไกการเรียงลำดับทริกเกอร์

ตัวชี้วัดประสิทธิภาพ

การประมวลผลล่าช้า:

82 มิลลิวินาที (Jetson AGX Orin)

ความแม่นยำ:

การตรวจจับข้อบกพร่องจากการฉีดขึ้นรูปสูงถึง 98.7%

2

นัยสำคัญของ DeepSeek R1: ผู้ชนะและผู้แพ้ในห่วงโซ่คุณค่า AI เชิงสร้างสรรค์

การเพิ่มประสิทธิภาพการไหลของกระบวนการ

เทคโนโลยีที่สำคัญ

การโต้ตอบภาษาธรรมชาติ:

ผู้ปฏิบัติงานอธิบายความผิดปกติของอุปกรณ์โดยใช้เสียง (เช่น "ความผันผวนของแรงดันของเครื่องอัดรีด ±0.3 MPa")

การใช้เหตุผลแบบหลายโหมด:

แบบจำลองนี้จะสร้างข้อเสนอแนะในการปรับปรุงประสิทธิภาพโดยอิงตามข้อมูลในประวัติอุปกรณ์ (เช่น ปรับความเร็วของสกรูเป็น 2.5%)

การตรวจสอบฝาแฝดทางดิจิทัล:

การตรวจสอบการจำลองพารามิเตอร์บนแพลตฟอร์ม EdgeX Foundry

ผลการดำเนินการ

โรงงานเคมีของ BASF นำแผนดังกล่าวมาใช้ ส่งผลให้ลดการใช้พลังงานลงได้ 17% และเพิ่มอัตราคุณภาพผลิตภัณฑ์ได้ 9%

3

Edge AI และอนาคตของธุรกิจ: OpenAI o1 เทียบกับ DeepSeek R1 สำหรับการดูแลสุขภาพ ยานยนต์ และ IIoT

การดึงข้อมูลฐานความรู้ทันที

การออกแบบสถาปัตยกรรม

ฐานข้อมูลเวกเตอร์ท้องถิ่น:

ใช้ ChromaDB เพื่อจัดเก็บคู่มืออุปกรณ์และข้อมูลจำเพาะของกระบวนการ (มิติการฝัง 768)

การดึงข้อมูลแบบไฮบริด:

รวมอัลกอริทึม BM25 + ความคล้ายคลึงของโคไซน์สำหรับการค้นหา

การสร้างผลลัพธ์:

โมเดล R1-7B สรุปและปรับแต่งผลลัพธ์การค้นคืน

กรณีทั่วไป

วิศวกรของซีเมนส์แก้ไขปัญหาความผิดพลาดของอินเวอร์เตอร์โดยใช้การสอบถามภาษาธรรมชาติ ซึ่งช่วยลดเวลาในการประมวลผลเฉลี่ยลง 58%

ความท้าทายและแนวทางแก้ไขในการปรับใช้

ข้อจำกัดของหน่วยความจำ:

ใช้เทคโนโลยีการวัดปริมาณแคช KV ลดการใช้หน่วยความจำของรุ่น 14B จาก 32GB เหลือ 9GB

การรับประกันประสิทธิภาพแบบเรียลไทม์:

ปรับความเสถียรของค่าความหน่วงในการอนุมานเดี่ยวเป็น ±15 มิลลิวินาทีด้วยการเพิ่มประสิทธิภาพของ CUDA Graph

โมเดลดริฟท์:

อัปเดตเพิ่มเติมทุกสัปดาห์ (ส่งเพียง 2% ของพารามิเตอร์)

สภาพแวดล้อมที่รุนแรง:

ออกแบบมาสำหรับช่วงอุณหภูมิที่กว้างตั้งแต่ -40°C ถึง 85°C โดยมีระดับการป้องกัน IP67

5
微信Image_20240614024031.jpg1

บทสรุป

ปัจจุบัน ต้นทุนการใช้งานลดลงเหลือ 599 ดอลลาร์ต่อโหนด (Jetson Orin NX) โดยมีแอปพลิเคชันที่ปรับขนาดได้เกิดขึ้นในภาคส่วนต่างๆ เช่น การผลิต 3C การประกอบยานยนต์ และเคมีพลังงาน การปรับปรุงสถาปัตยกรรม MoE และเทคโนโลยีการวัดปริมาณอย่างต่อเนื่องคาดว่าจะทำให้โมเดล 70B สามารถทำงานบนอุปกรณ์เอดจ์ได้ภายในสิ้นปี 2025

ค้นหาโซลูชันสายเคเบิล ELV

สายควบคุม

สำหรับ BMS, BUS, อุตสาหกรรม, สายเครื่องมือวัด

ระบบเดินสายแบบมีโครงสร้าง

เครือข่ายและข้อมูล, สายไฟเบอร์ออปติก, สายแพทช์, โมดูล, แผงหน้าปัด

บทวิจารณ์งานนิทรรศการและกิจกรรมประจำปี 2024

16-18 เมษายน 2567 พลังงานตะวันออกกลางในดูไบ

16-18 เมษายน 2024 Securika ในมอสโก

งานเปิดตัวผลิตภัณฑ์และเทคโนโลยีใหม่ในวันที่ 9 พฤษภาคม 2024 ในเซี่ยงไฮ้

วันที่ 22-25 ตุลาคม 2024 งาน SECURITY CHINA ณ ปักกิ่ง

19-20 พฤศจิกายน 2024 CONNECTED WORLD KSA


เวลาโพสต์ : 07-02-2025