การวิเคราะห์เชิงลึกของ Multi-Agent: ในที่สุด Web3 และ AI จะเสริมซึ่งกันและกันหรือไม่
หาก AIGC เป็นผู้นำยุคแห่งการสร้างเนื้อหาที่มีความอัจฉริยะ AI Agent ก็มีโอกาสที่จะนำความสามารถของ AIGC ไปใช้ในเชิงพาณิชย์ได้อย่างแท้จริง
AI Agent เป็นเหมือนพนักงานที่มีความเป็นรูปธรรมและมีความสามารถรอบด้านมากขึ้น เป็นที่รู้จักในฐานะรูปแบบหลักของหุ่นยนต์ปัญญาประดิษฐ์ มันสามารถสังเกตสภาพแวดล้อมโดยรอบ ตัดสินใจ และดำเนินการโดยอัตโนมัติเช่นเดียวกับมนุษย์
Bill Gates เคยกล่าวไว้ว่า การเชี่ยวชาญ AI Agent ถือเป็นความสำเร็จที่แท้จริง เมื่อถึงเวลานั้น คุณจะไม่ต้องค้นหาข้อมูลบนอินเทอร์เน็ตอีกต่อไป ผู้เชี่ยวชาญที่น่าเชื่อถือในด้าน AI ก็มีความหวังสูงต่อโอกาสของ AI Agent เช่นกัน Satya Nadella ซีอีโอของ Microsoft เคยทำนายไว้ว่า AI Agent จะกลายเป็นช่องทางหลักในการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ ซึ่งสามารถเข้าใจความต้องการของผู้ใช้และให้บริการได้อย่างแข็งขัน ศาสตราจารย์ Andrew Ng ยังทำนายไว้ด้วยว่าในสภาพแวดล้อมการทำงานในอนาคต มนุษย์และ AI Agent จะร่วมมือกันอย่างใกล้ชิดมากขึ้นเพื่อสร้างรูปแบบการทำงานที่มีประสิทธิภาพและปรับปรุงประสิทธิภาพ
AI Agent ไม่เพียงแต่เป็นผลิตภัณฑ์จากเทคโนโลยีเท่านั้น แต่ยังเป็นแกนหลักของวิถีชีวิตและการทำงานในอนาคตอีกด้วย
สิ่งนี้เตือนเราว่าเมื่อ Web3 และบล็อคเชนเริ่มมีการพูดคุยกันอย่างกว้างขวาง ผู้คนมักใช้คำว่าการหยุดชะงักเพื่ออธิบายถึงศักยภาพของเทคโนโลยีนี้ เมื่อมองย้อนกลับไปในช่วงไม่กี่ปีที่ผ่านมา Web3 ค่อยๆ พัฒนาจาก ERC-20 เบื้องต้นและการพิสูจน์ความรู้เป็นศูนย์ไปเป็น DeFi, DePIN, GameFi เป็นต้น ซึ่งบูรณาการกับสาขาอื่นๆ
หากนำ Web3 และ AI ซึ่งเป็นเทคโนโลยีดิจิทัลยอดนิยม 2 ประเภทมารวมกัน จะเกิดผลแบบ 1+1>2 หรือไม่ โปรเจกต์ Web3 AI ซึ่งกำลังระดมทุนเพิ่มขึ้นเรื่อยๆ จะสามารถนำรูปแบบการใช้งานใหม่ๆ มาสู่ภาคอุตสาหกรรมและสร้างความต้องการที่แท้จริงใหม่ๆ ได้หรือไม่
AI Agent: ผู้ช่วยอัจฉริยะที่เหมาะสมที่สุดสำหรับมนุษย์
จินตนาการของ AI Agent อยู่ที่ไหน คำตอบที่เป็นที่นิยมบนอินเทอร์เน็ตคือ โมเดลภาษาขนาดใหญ่สามารถเขียนโปรแกรมงูได้เท่านั้น แต่ AI Agent สามารถเขียนโปรแกรม King of Glory ได้ทั้งหมด ฟังดูเกินจริง แต่ก็ไม่ใช่การเกินจริง
ตัวแทนมักแปลว่าร่างกายอัจฉริยะในประเทศจีน แนวคิดนี้ได้รับการเสนอโดยมินสกี้ บิดาแห่งปัญญาประดิษฐ์ในหนังสือของเขาเรื่อง The Society of Thought ซึ่งตีพิมพ์ในปี 1986 มินสกี้เชื่อว่าบุคคลบางคนในสังคมสามารถหาทางแก้ไขปัญหาได้หลังจากการเจรจา และบุคคลเหล่านี้คือตัวแทน เป็นเวลาหลายปีที่ตัวแทนเป็นรากฐานของการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ ตั้งแต่โปรแกรมช่วยแก้ไขของไมโครซอฟต์อย่าง Clippy ไปจนถึงคำแนะนำอัตโนมัติของ Google Docs ตัวแทนในรูปแบบแรกๆ เหล่านี้แสดงให้เห็นถึงศักยภาพในการโต้ตอบแบบเฉพาะบุคคล แต่ความสามารถในการจัดการงานที่ซับซ้อนมากขึ้นยังคงจำกัดอยู่ จนกระทั่งมีการเกิดขึ้นของโมเดลภาษาขนาดใหญ่ (LLM) จึงได้ค้นพบศักยภาพที่แท้จริงของตัวแทน
ในเดือนพฤษภาคม ปีนี้ ศาสตราจารย์แอนดรูว์ หง นักวิชาการผู้ทรงคุณวุฒิด้านปัญญาประดิษฐ์ ได้กล่าวสุนทรพจน์เกี่ยวกับ AI Agent ในงาน Sequoia AI ที่สหรัฐอเมริกา โดยในสุนทรพจน์ดังกล่าว เขาได้สาธิตชุดการทดลองที่ทีมของเขาทำขึ้น ดังนี้
ให้ AI เขียนโค้ดและรันโค้ด จากนั้นเปรียบเทียบผลลัพธ์ของ LLM และเวิร์กโฟลว์ต่างๆ ผลลัพธ์เป็นดังนี้:
-
รุ่น GPT-3.5 : ความแม่นยำ 48%
-
รุ่น GPT-4: ความแม่นยำ 67%
-
GPT-3.5 + Agent: ประสิทธิภาพสูงกว่ารุ่น GPT-4
-
GPT-4 + Agent : ดีกว่ารุ่น GPT-4 มาก ดีมาก
แท้จริงแล้ว คนส่วนใหญ่มักใช้ LLM เช่น ChatGPT ในลักษณะต่อไปนี้: พวกเขาป้อนคำกระตุ้น และโมเดลขนาดใหญ่จะสร้างคำตอบทันที โดยไม่ระบุและแก้ไขข้อผิดพลาด ลบ หรือเขียนใหม่โดยอัตโนมัติ
ในทางตรงกันข้าม เวิร์กโฟลว์ของ AI Agent มีลักษณะดังนี้:
ขั้นแรก ให้ LLM เขียนโครงร่างบทความ หากจำเป็น ให้ค้นหาเนื้อหาบนอินเทอร์เน็ตเพื่อการวิจัยและวิเคราะห์ จากนั้นจึงพิมพ์ร่างแรก จากนั้นอ่านร่างและคิดว่าจะปรับให้เหมาะสมอย่างไร ทำซ้ำขั้นตอนนี้หลายๆ ครั้งเพื่อให้ได้บทความคุณภาพสูงที่มีตรรกะที่เข้มงวดและอัตราข้อผิดพลาดต่ำที่สุด
เราจะเห็นได้ว่าความแตกต่างระหว่าง AI Agent กับ LLM คือการโต้ตอบระหว่าง LLM กับมนุษย์นั้นขึ้นอยู่กับคำกระตุ้น AI Agent จะต้องกำหนดเป้าหมายเท่านั้น และสามารถคิดและดำเนินการเพื่อบรรลุเป้าหมายได้ด้วยตนเอง AI Agent จะแบ่งขั้นตอนของแผนแต่ละขั้นตอนอย่างละเอียดตามงานที่ได้รับมอบหมาย อาศัยคำติชมจากโลกภายนอกและการคิดอย่างอิสระ และสร้างคำกระตุ้นเพื่อให้บรรลุเป้าหมาย
ดังนั้น OpenAI จึงกำหนด AI Agent ว่าเป็น: ระบบที่ขับเคลื่อนโดย LLM เป็นสมอง ซึ่งมีความสามารถในการเข้าใจการรับรู้ การวางแผน ความจำ และการใช้เครื่องมือต่างๆ โดยอัตโนมัติ และสามารถทำงานที่ซับซ้อนได้โดยอัตโนมัติ
เมื่อ AI เปลี่ยนจากเครื่องมือไปเป็นวัตถุที่สามารถใช้เครื่องมือได้ ก็จะกลายเป็นตัวแทน AI ด้วยเหตุนี้ AI Agent จึงสามารถเป็นผู้ช่วยอัจฉริยะที่เหมาะสมที่สุดสำหรับมนุษย์ได้ ตัวอย่างเช่น AI Agent สามารถเข้าใจและจดจำความสนใจ การตั้งค่า และนิสัยประจำวันของผู้ใช้โดยอิงจากปฏิสัมพันธ์ออนไลน์ในอดีต ระบุเจตนาของผู้ใช้ เสนอแนะอย่างเป็นเชิงรุก และประสานงานแอปพลิเคชันหลายตัวเพื่อทำงานให้เสร็จสมบูรณ์
ดังเช่นที่เกตส์ได้คาดการณ์ไว้ ในอนาคต เราจะไม่จำเป็นต้องสลับไปใช้แอปพลิเคชันอื่นสำหรับงานที่แตกต่างกันอีกต่อไป เราเพียงแค่ต้องใช้ภาษาธรรมดาเพื่อบอกคอมพิวเตอร์และโทรศัพท์มือถือว่าเราต้องการทำอะไร โดยอิงจากข้อมูลที่ผู้ใช้เต็มใจแบ่งปัน ตัวแทน AI จะให้คำตอบที่เป็นรายบุคคล
บริษัทยูนิคอร์นที่มีพนักงานเพียงคนเดียวกำลังจะกลายเป็นความจริง
AI Agent ยังช่วยให้บริษัทต่างๆ สร้างโมเดลการทำงานอัจฉริยะแบบใหม่ที่มีความร่วมมือระหว่างมนุษย์กับเครื่องจักรเป็นแกนหลัก กิจกรรมทางธุรกิจต่างๆ มากขึ้นเรื่อยๆ จะดำเนินการโดย AI ในขณะที่มนุษย์ต้องมุ่งเน้นเฉพาะการตัดสินใจเกี่ยวกับวิสัยทัศน์ กลยุทธ์ และเส้นทางสำคัญขององค์กรเท่านั้น
ดังที่ Sam Altman ซีอีโอของ OpenAI เคยกล่าวไว้ในบทสัมภาษณ์ว่า ด้วยการพัฒนา AI เราจะเข้าสู่ยุคของบริษัทที่ก่อตั้งโดยบุคคลเพียงคนเดียว ซึ่งก็คือบริษัทที่ก่อตั้งโดยบุคคลเพียงคนเดียวและมีมูลค่า $1 พันล้าน
ฟังดูเหมือนเป็นจินตนาการ แต่ด้วยความช่วยเหลือของ AI Agent ไอเดียนี้ก็เริ่มกลายเป็นความจริง
ลองสมมติว่าเรากำลังเริ่มต้นธุรกิจสตาร์ทอัพด้านเทคโนโลยี ตามแนวทางแบบเดิม ฉันจำเป็นต้องจ้างวิศวกรซอฟต์แวร์ ผู้จัดการผลิตภัณฑ์ นักออกแบบ นักการตลาด ฝ่ายขาย และฝ่ายการเงิน ซึ่งแต่ละคนมีหน้าที่ความรับผิดชอบที่แตกต่างกัน แต่ทั้งหมดได้รับความร่วมมือจากฉัน
ดังนั้นหากฉันใช้ AI Agent ฉันอาจไม่จำเป็นต้องจ้างพนักงานเลย
-
เดวิน — การเขียนโปรแกรมอัตโนมัติ
แทนที่จะเป็นวิศวกรซอฟต์แวร์ ฉันอาจใช้เดวิน ซึ่งเป็นวิศวกรซอฟต์แวร์ AI ที่ได้รับความนิยมอย่างมากในปีนี้ ซึ่งสามารถช่วยฉันทำงานด้านฟรอนต์เอนด์และแบ็กเอนด์ทั้งหมดให้เสร็จสมบูรณ์ได้
Devin ได้รับการพัฒนาโดย Cognition Labs และเป็นที่รู้จักในฐานะวิศวกรซอฟต์แวร์ AI คนแรกของโลก โดยสามารถทำงานพัฒนาซอฟต์แวร์ทั้งหมดได้ด้วยตนเอง วิเคราะห์ปัญหา ตัดสินใจ เขียนโค้ด และแก้ไขข้อผิดพลาดได้ด้วยตนเอง ซึ่งช่วยลดภาระงานของนักพัฒนาได้อย่างมาก Devin ได้รับเงินทุน $196 ล้านดอลลาร์ในเวลาเพียงครึ่งปี และมูลค่าของบริษัทพุ่งสูงขึ้นอย่างรวดเร็วแตะระดับพันล้านดอลลาร์ นักลงทุนรวมถึงบริษัทเงินร่วมลงทุนที่มีชื่อเสียง เช่น Founders Fund และ Khosla Ventures
แม้ว่า Devin จะยังไม่ได้เปิดตัวเวอร์ชันสาธารณะ แต่เราจะได้เห็นศักยภาพของมันจากผลิตภัณฑ์ Web2 ยอดนิยมอีกตัวหนึ่งอย่าง Cursor ซึ่งสามารถทำงานได้เกือบทั้งหมดแทนคุณ โดยเปลี่ยนไอเดียง่ายๆ ให้กลายเป็นโค้ดที่ใช้งานได้ภายในเวลาไม่กี่นาที คุณเพียงแค่ต้องออกคำสั่งแล้วนั่งรอรับผลลัพธ์ได้เลย มีรายงานว่าเด็กอายุแปดขวบคนหนึ่งซึ่งไม่มีประสบการณ์การเขียนโปรแกรมเลย ได้ใช้ Cursor เพื่อเขียนโค้ดจนเสร็จเรียบร้อย และสร้างเว็บไซต์ขึ้นมาได้
-
Hebbia — การจัดการไฟล์
แทนที่จะเป็นผู้จัดการผลิตภัณฑ์หรือผู้รับผิดชอบด้านการเงิน ฉันอาจเลือก Hebbia ซึ่งสามารถช่วยฉันจัดระเบียบและวิเคราะห์เอกสารทั้งหมดได้
ต่างจาก Glean ซึ่งเน้นที่การค้นหาเอกสารภายในองค์กร Hebbia Matrix เป็นแพลตฟอร์มตัวแทน AI ระดับองค์กรที่ใช้โมเดล AI หลายแบบเพื่อช่วยให้ผู้ใช้แยกโครงสร้างและวิเคราะห์ข้อมูลและเอกสารได้อย่างมีประสิทธิภาพ จึงช่วยขับเคลื่อนการปรับปรุงประสิทธิภาพการทำงานขององค์กร ที่น่าประทับใจคือ Matrix สามารถประมวลผลเอกสารได้หลายล้านฉบับพร้อมกัน
Hebbia ได้ระดมทุนรอบ Series B มูลค่า $130 ล้านในเดือนกรกฎาคมของปีนี้ นำโดย a16z และมีนักลงทุนที่มีชื่อเสียง เช่น Google Ventures และ Peter Thiel เข้าร่วมด้วย
-
Jasper AI — การสร้างเนื้อหา
แทนที่จะทำงานด้านโซเชียลมีเดียและออกแบบ ฉันอาจเลือก Jasper AI ซึ่งสามารถช่วยฉันสร้างเนื้อหาได้
Jasper AI คือผู้ช่วยเขียน AI Agent ที่ออกแบบมาเพื่อช่วยให้ผู้สร้าง นักการตลาด และธุรกิจต่างๆ ปรับปรุงกระบวนการสร้างเนื้อหา และปรับปรุงประสิทธิภาพการผลิตและการสร้างสรรค์ Jasper AI สามารถสร้างเนื้อหาได้หลายประเภทตามรูปแบบที่ผู้ใช้ต้องการ รวมถึงโพสต์บล็อก โพสต์โซเชียลมีเดีย เนื้อหาโฆษณา และคำอธิบายผลิตภัณฑ์ นอกจากนี้ยังสร้างรูปภาพตามคำอธิบายของผู้ใช้เพื่อช่วยสนับสนุนเนื้อหาข้อความด้วยภาพ
Jasper AI ได้รับเงินทุน $125 ล้านดอลลาร์สหรัฐ และมีมูลค่าถึง $1.5 พันล้านดอลลาร์สหรัฐในปี 2022 ตามสถิติ Jasper AI ช่วยให้ผู้ใช้สร้างคำศัพท์ได้มากกว่า 500 ล้านคำ และกลายเป็นหนึ่งในเครื่องมือเขียนด้วย AI ที่ใช้กันอย่างแพร่หลายที่สุด
-
MultiOn — ระบบอัตโนมัติบนเว็บ
แทนที่จะมีผู้ช่วย ฉันอาจเลือก MultiOn เพื่อช่วยจัดการงานประจำวัน จัดตารางเวลา ตั้งการแจ้งเตือน และแม้แต่วางแผนการเดินทางเพื่อธุรกิจ จองโรงแรมโดยอัตโนมัติ และจัดการรถแท็กซี่ออนไลน์
MultiOn เป็นตัวแทน AI สำหรับงานบนเว็บอัตโนมัติที่สามารถช่วยดำเนินการงานต่างๆ โดยอัตโนมัติในสภาพแวดล้อมดิจิทัลใดๆ เช่น ช่วยให้ผู้ใช้ดำเนินการงานส่วนตัว เช่น การช้อปปิ้งออนไลน์และการจองนัดหมายเพื่อปรับปรุงประสิทธิภาพส่วนตัว หรือช่วยให้ผู้ใช้ลดความซับซ้อนของงานประจำวันและเพิ่มประสิทธิภาพในการทำงาน
-
ความสับสน — การค้นหา การค้นคว้า
หากจะเป็นทางเลือกอื่นนอกจากนักวิจัย ฉันคงเลือก Perplexity ซึ่งเป็นสิ่งที่ซีอีโอของ Nvidia ใช้ทุกวัน
Perplexity คือเครื่องมือค้นหา AI ที่เข้าใจคำถามของผู้ใช้ แบ่งแยกคำถามออกเป็นส่วนๆ จากนั้นค้นหาและผสานรวมเนื้อหา และสร้างรายงานเพื่อให้ผู้ใช้ได้รับคำตอบที่ชัดเจน
ความสับสนเหมาะสำหรับกลุ่มผู้ใช้ต่างๆ ตัวอย่างเช่น นักเรียนและนักวิจัยสามารถลดความซับซ้อนของกระบวนการค้นหาข้อมูลเมื่อเขียนและปรับปรุงประสิทธิภาพ นักการตลาดสามารถรับข้อมูลที่เชื่อถือได้เพื่อสนับสนุนกลยุทธ์การตลาด
เนื้อหาข้างต้นเป็นเพียงจินตนาการเท่านั้น ความสามารถและระดับที่แท้จริงของตัวแทน AI เหล่านี้ไม่เพียงพอที่จะทดแทนบุคลากรที่มีความสามารถสูงในอุตสาหกรรมต่างๆ ได้ ดังที่ Li Bojie ผู้ก่อตั้งร่วมของ Logenic AI กล่าว ความสามารถ LLM ในปัจจุบันมีเฉพาะในระดับเริ่มต้นเท่านั้น ซึ่งยังห่างไกลจากระดับผู้เชี่ยวชาญ ในขั้นตอนนี้ ตัวแทน AI จะเหมือนกับพนักงานที่ทำงานเร็วกว่าแต่ไม่น่าเชื่อถือมากนัก
อย่างไรก็ตาม ตัวแทน AI เหล่านี้ซึ่งมีจุดแข็งเฉพาะตัวจะช่วยให้ผู้ใช้ที่มีอยู่ปรับปรุงประสิทธิภาพและความสะดวกสบายในสถานการณ์ต่างๆ
ไม่เพียงแต่บริษัทเทคโนโลยีเท่านั้น แต่ทุกสาขาอาชีพก็สามารถได้รับประโยชน์จากเอเจนต์ AI ในด้านการศึกษา เอเจนต์ AI สามารถจัดหาแหล่งข้อมูลการเรียนรู้ส่วนบุคคลและคำแนะนำตามความก้าวหน้าในการเรียนรู้ ความสนใจ และความสามารถของนักเรียน ในด้านการเงิน เอเจนต์ AI สามารถช่วยให้ผู้ใช้จัดการการเงินส่วนบุคคล ให้คำแนะนำด้านการลงทุน และแม้แต่คาดการณ์แนวโน้มของหุ้น ในด้านการแพทย์ เอเจนต์ AI สามารถช่วยให้แพทย์วินิจฉัยโรคและจัดทำแผนการรักษาได้ ในด้านอีคอมเมิร์ซ เอเจนต์ AI ยังสามารถทำหน้าที่เป็นฝ่ายบริการลูกค้าอัจฉริยะ โดยตอบคำถามของผู้ใช้โดยอัตโนมัติ จัดการปัญหาการสั่งซื้อและคำขอส่งคืนสินค้าผ่านการประมวลผลภาษาธรรมชาติและเทคโนโลยีการเรียนรู้ของเครื่องจักร จึงช่วยปรับปรุงประสิทธิภาพการบริการลูกค้าได้
ตัวแทนหลายราย: ขั้นตอนต่อไปสำหรับตัวแทน AI
ในส่วนก่อนหน้านี้เกี่ยวกับแนวคิดของบริษัทยูนิคอร์นที่มีพนักงานเพียงคนเดียว ตัวแทน AI เพียงตัวเดียวจะเผชิญกับข้อจำกัดในการจัดการงานที่ซับซ้อนและยากต่อการตอบสนองความต้องการที่แท้จริง เมื่อใช้ตัวแทน AI หลายตัว เนื่องจากตัวแทน AI เหล่านี้ใช้ LLM ที่แตกต่างกัน การตัดสินใจร่วมกันจึงทำได้ยากและความสามารถของตัวแทนเหล่านี้ก็จำกัด ดังนั้น จึงต้องให้มนุษย์ทำหน้าที่เป็นผู้ควบคุมระหว่างตัวแทน AI อิสระเหล่านี้เพื่อประสานงานการทำงานของตัวแทน AI เหล่านี้ที่ให้บริการสถานการณ์การใช้งานที่แตกต่างกัน สิ่งนี้ทำให้เกิด Multi-Agent (กรอบงานตัวแทนหลายตัว) ขึ้นมา
ปัญหาที่ซับซ้อนมักต้องการการบูรณาการความรู้และทักษะที่หลากหลาย แต่เอเจนต์ AI ตัวเดียวมีขีดความสามารถที่จำกัดและไม่สามารถรับมือกับสิ่งเหล่านี้ได้ ระบบมัลติเอเจนต์ช่วยให้เอเจนต์ AI ใช้จุดแข็งที่มีอยู่ได้อย่างเต็มที่ เรียนรู้จากจุดแข็งของกันและกัน และชดเชยจุดอ่อนของกันและกัน จึงสามารถแก้ไขปัญหาที่ซับซ้อนได้อย่างมีประสิทธิภาพมากขึ้น
สิ่งนี้คล้ายคลึงกับเวิร์กโฟลว์หรือโครงสร้างองค์กรของเรามาก: ผู้นำจะมอบหมายงาน ผู้ที่มีความสามารถต่างกันจะรับผิดชอบงานที่แตกต่างกัน ผลลัพธ์ของแต่ละกระบวนการจะถูกส่งต่อไปยังกระบวนการถัดไป และในที่สุดก็จะได้ผลลัพธ์ของงานขั้นสุดท้าย
ในกระบวนการใช้งาน ตัวแทน AI ระดับล่างจะดำเนินภารกิจของตนเอง ในขณะที่ตัวแทน AI ระดับสูงจะมอบหมายงานและควบคุมดูแลการดำเนินการให้เสร็จสมบูรณ์
นอกจากนี้ ตัวแทนหลายตัวยังสามารถจำลองกระบวนการตัดสินใจของมนุษย์ได้ เช่นเดียวกับเมื่อเราประสบปัญหา เราจะปรึกษาหารือกับผู้อื่น ตัวแทน AI หลายตัวยังสามารถจำลองพฤติกรรมการตัดสินใจร่วมกันและให้การสนับสนุนข้อมูลที่ดีกว่าแก่เรา ตัวอย่างเช่น AutoGen ที่พัฒนาโดย Microsoft ตอบสนองความต้องการนี้:
-
ความสามารถในการสร้างตัวแทน AI ที่มีบทบาทที่แตกต่างกัน ตัวแทน AI เหล่านี้มีความสามารถในการสนทนาขั้นพื้นฐานและสามารถสร้างการตอบกลับตามข้อความที่ได้รับ
-
ใช้ GroupChat เพื่อสร้างสภาพแวดล้อมการแชทแบบกลุ่มที่มีตัวแทน AI หลายราย ใน GroupChat นี้ มีตัวแทน AI ที่มีบทบาทเป็นผู้ดูแลระบบเพื่อจัดการบันทึกการแชท ลำดับการพูด และการยุติการพูดของตัวแทน AI อื่นๆ
หากนำไปใช้กับแนวคิดของบริษัทที่มีพนักงานเพียงคนเดียว เราสามารถใช้สถาปัตยกรรมมัลติเอเจนต์เพื่อสร้างเอเจนต์ AI หลายตัวที่มีบทบาทต่างกัน เช่น ผู้จัดการโครงการ โปรแกรมเมอร์ หรือหัวหน้างาน เราบอกเป้าหมายของเราให้พวกเขาทราบและปล่อยให้พวกเขาคิดหาวิธีแก้ไขปัญหา เราเพียงแค่ต้องฟังรายงานของพวกเขาและปล่อยให้พวกเขาทำการเปลี่ยนแปลงหากเรามีความคิดเห็นหรือหากพวกเขาทำสิ่งที่ผิดจนกว่าพวกเขาจะพอใจ
เมื่อเปรียบเทียบกับ AI Agent ตัวเดียว Multi-Agent สามารถบรรลุสิ่งต่อไปนี้ได้:
-
ความสามารถในการปรับขนาด: จัดการกับปัญหาที่ใหญ่ขึ้นโดยเพิ่มจำนวนตัวแทน AI โดยแต่ละตัวจะรับผิดชอบงานบางส่วน ช่วยให้ระบบปรับขนาดได้ตามความต้องการที่เพิ่มขึ้น
-
การประมวลผลแบบคู่ขนาน: รองรับการประมวลผลแบบขนานโดยธรรมชาติ ตัวแทน AI หลายตัวสามารถทำงานกับส่วนต่างๆ ของปัญหาได้ในเวลาเดียวกัน จึงช่วยเร่งความเร็วในการแก้ปัญหา
-
การปรับปรุงการตัดสินใจ: ปรับปรุงการตัดสินใจด้วยการรวบรวมข้อมูลเชิงลึกจากตัวแทน AI หลายตัว โดยแต่ละตัวมีมุมมองและความเชี่ยวชาญเป็นของตัวเอง
เนื่องจากเทคโนโลยี AI ยังคงก้าวหน้าต่อไป จึงเป็นไปได้ที่กรอบงาน Multi-Agent จะมีบทบาทมากขึ้นในอุตสาหกรรมต่างๆ และส่งเสริมการพัฒนาโซลูชั่นใหม่ๆ ที่ขับเคลื่อนด้วย AI ต่างๆ
ตัวแทน AI กำลังมาสู่ Web3
เมื่อก้าวออกจากห้องปฏิบัติการ AI Agent และ Multi-Agent ยังคงต้องก้าวไปอีกไกล
หากมองข้าม Multi-Agent ไปแล้ว แม้แต่ AI Agent ตัวเดียวที่ล้ำหน้าที่สุดก็ยังมีขีดจำกัดที่ชัดเจนสำหรับทรัพยากรการประมวลผลและพลังการประมวลผลที่ต้องการในระดับกายภาพ และไม่สามารถขยายออกไปได้อย่างไม่มีที่สิ้นสุด เมื่อต้องเผชิญกับงานที่ซับซ้อนและต้องใช้การคำนวณอย่างหนัก AI Agent จะต้องพบกับปัญหาเหล่านี้แน่นอน คอขวดในการคำนวณ และประสิทธิภาพการทำงานก็จะลดลงอย่างมาก
นอกจากนี้ ระบบ AI Agent และ Multi-Agent เป็นสิ่งสำคัญ รูปแบบสถาปัตยกรรมแบบรวมศูนย์ ซึ่งระบุว่ามีความเสี่ยงสูงมากที่จะล้มเหลวเพียงครั้งเดียว ที่สำคัญกว่านั้น โมเดลธุรกิจผูกขาดที่อิงตามโมเดลขนาดใหญ่แบบปิดของบริษัทต่างๆ เช่น OpenAI, Microsoft และ Google คุกคามสภาพแวดล้อมการอยู่รอดของบริษัทสตาร์ทอัพเอเจนต์ AI อิสระและเอเจนต์เดี่ยวอย่างจริงจัง ทำให้เอเจนต์ AI ไม่สามารถใช้ข้อมูลส่วนตัวขององค์กรขนาดใหญ่ได้อย่างราบรื่นเพื่อให้พวกเขาฉลาดขึ้นและมีประสิทธิภาพมากขึ้น เอเจนต์ AI จำเป็นต้องมีสภาพแวดล้อมการทำงานร่วมกันแบบประชาธิปไตยอย่างเร่งด่วน เพื่อให้ ตัวแทน AI ที่มีคุณค่าอย่างแท้จริง สามารถรองรับกลุ่มผู้คนที่มีความต้องการหลากหลายยิ่งขึ้น และสร้างคุณค่าให้แก่สังคมมากยิ่งขึ้น
แม้ว่า AI Agent จะมีความใกล้ชิดกับอุตสาหกรรมมากกว่า LLM แต่การพัฒนานั้นขึ้นอยู่กับ LLM ปัจจุบันโมเดลขนาดใหญ่มีลักษณะเฉพาะคือมีอุปสรรคทางเทคนิคสูง มีการลงทุนด้านทุนสูง และมีโมเดลธุรกิจที่ยังไม่พัฒนา AI Agent มักพบว่าการได้รับเงินทุนสำหรับการอัปเดตและการทำซ้ำอย่างต่อเนื่องเป็นเรื่องยาก
รูปแบบมัลติเอเจนต์เป็นแนวทางที่ดีเยี่ยมสำหรับ Web3 ในการช่วย AI ทีมพัฒนา Web3 จำนวนมากได้ลงทุนด้านการวิจัยและพัฒนาเพื่อนำเสนอโซลูชันในด้านเหล่านี้แล้ว
ระบบเอเจนต์ AI และมัลติเอเจนต์มักต้องการทรัพยากรคอมพิวเตอร์จำนวนมากเพื่อทำการตัดสินใจที่ซับซ้อนและดำเนินการงานต่างๆ Web3 สามารถสร้างตลาดพลังการประมวลผลแบบกระจายอำนาจผ่านบล็อคเชนและเทคโนโลยีแบบกระจายอำนาจ เพื่อให้สามารถกระจายและใช้ทรัพยากรพลังการประมวลผลได้อย่างยุติธรรมและมีประสิทธิภาพมากขึ้นในระดับโลก โปรเจ็กต์ Web3 เช่น Akash, Nosana, Aethir, IO.net เป็นต้น สามารถให้พลังการประมวลผลสำหรับการตัดสินใจและการใช้เหตุผลของเอเจนต์ AI
ระบบ AI แบบดั้งเดิมมักได้รับการจัดการในลักษณะรวมศูนย์ ซึ่งทำให้ตัวแทน AI เผชิญกับความล้มเหลวจากจุดเดียวและปัญหาความเป็นส่วนตัวของข้อมูล ลักษณะการกระจายอำนาจของ Web3 สามารถทำให้ระบบมัลติเอเจนต์กระจายอำนาจและทำงานอัตโนมัติมากขึ้น ตัวแทน AI แต่ละตัวสามารถทำงานบนโหนดต่างๆ ได้อย่างอิสระและดำเนินการตามข้อกำหนดของผู้ใช้โดยอัตโนมัติ ซึ่งช่วยเพิ่มความทนทานและความปลอดภัย การจัดตั้งกลไกจูงใจและการลงโทษสำหรับผู้ให้คำมั่นสัญญาและผู้มอบหมายผ่านกลไกต่างๆ เช่น PoS และ DPoS จะช่วยส่งเสริมการประชาธิปไตยของตัวแทน AI ตัวเดียวหรือระบบมัลติเอเจนต์
ในเรื่องนี้ GaiaNet, Theoriq, PIN AI และ HajimeAI ต่างก็มีความพยายามที่ล้ำสมัยมาก
-
Theoriq เป็นโครงการที่ให้บริการ AI สำหรับ Web3 โดยหวังว่าจะสร้างระบบการเรียกและระบบเศรษฐกิจสำหรับตัวแทน AI ผ่าน Agentic Protocol เผยแพร่การพัฒนา Web3 และสถานการณ์การทำงานต่างๆ มากมาย และจัดเตรียมความสามารถในการใช้เหตุผลแบบจำลองที่ตรวจสอบได้สำหรับ dApp ของ Web3
-
GaiaNet คือสภาพแวดล้อมการสร้างและการใช้งาน AI Agent บนโหนด ซึ่งมีเป้าหมายเพื่อปกป้องทรัพย์สินทางปัญญาและความเป็นส่วนตัวของข้อมูลของผู้เชี่ยวชาญและผู้ใช้ เพื่อรับมือกับ OpenAI GPT Store แบบรวมศูนย์
-
HajimeAI สร้างขึ้นบนพื้นฐานทั้งสองอย่างเพื่อสร้างเวิร์กโฟลว์ของ AI Agent ตามความต้องการที่แท้จริง และเพื่อทำให้เจตนาของตัวเองมีความชาญฉลาดและอัตโนมัติ สะท้อนให้เห็นถึงการปรับแต่งปัญญา AI ตามความต้องการที่กล่าวถึงโดย PIN AI
-
ในเวลาเดียวกัน Modulus Labs และ ORA Protocol ยังได้พัฒนาอัลกอริธึม zkML และ opML ของ AI Agents ตามลำดับ
ในที่สุด การพัฒนาและการทำซ้ำของ AI Agent และระบบ Multi-Agent มักจะต้องใช้การสนับสนุนทางการเงินเป็นจำนวนมาก และ Web3 สามารถช่วยให้โครงการ AI Agent ที่มีศักยภาพได้รับการสนับสนุนในช่วงเริ่มต้นที่มีคุณค่าผ่านคุณสมบัติสภาพคล่องด้านหน้า
ทั้ง Spectral และ HajimeAI ต่างเสนอแนวคิดเกี่ยวกับผลิตภัณฑ์ที่สนับสนุนการออกสินทรัพย์ของ AI Agent บนเครือข่าย โดยการออกโทเค็นผ่าน IAO (Initial Agent Offering) AI Agent สามารถรับเงินทุนจากนักลงทุนได้โดยตรงและกลายเป็นสมาชิกของการกำกับดูแล DAO ซึ่งมอบโอกาสให้นักลงทุนได้มีส่วนร่วมในการพัฒนาโครงการและแบ่งปันผลกำไรในอนาคต ในบรรดานั้น HajimeAIs Benchmark DAO หวังที่จะรวมคะแนน AI Agent แบบกระจายอำนาจและการออกสินทรัพย์ AI Agent ผ่านการระดมทุนจากมวลชนและแรงจูงใจจากโทเค็นเข้าด้วยกันอย่างเป็นธรรมชาติ เพื่อสร้างวงจรปิดของการระดมทุน AI Agent และการเริ่มต้นแบบเย็นตาม Web3 ซึ่งถือเป็นความพยายามที่ค่อนข้างแปลกใหม่เช่นกัน
กล่องแพนโดร่าของ AI ถูกเปิดออกแล้ว ทุกคนในนั้นต่างตื่นเต้นและสับสน ไม่มีใครรู้ว่าความกระตือรือร้นนั้นเป็นโอกาสหรือแนวปะการัง ทุกวันนี้ ทุกสาขาอาชีพไม่ได้อยู่ในยุคของการระดมทุน PPT อีกต่อไป ไม่ว่าเทคโนโลยีจะล้ำสมัยเพียงใด ก็จะตระหนักถึงคุณค่าได้ก็ต่อเมื่อนำไปใช้งานจริงเท่านั้น อนาคตของ AI Agent ถูกกำหนดให้เป็นมาราธอนระยะยาว และ Web3 กำลังทำให้มั่นใจว่าจะไม่มีวันตกยุค
บทความนี้มีที่มาจากอินเทอร์เน็ต: การวิเคราะห์เชิงลึกของ Multi-Agent: ในที่สุด Web3 และ AI จะเสริมซึ่งกันและกันหรือไม่?
ตามสถิติที่ไม่สมบูรณ์จาก Odaily Planet Daily มีการประกาศกิจกรรมระดมทุนบล็อคเชน 15 รายการทั้งในประเทศและต่างประเทศตั้งแต่วันที่ 29 กรกฎาคมถึง 4 สิงหาคม ซึ่งลดลงจากข้อมูลสัปดาห์ที่แล้ว (23) จำนวนเงินระดมทุนทั้งหมดที่เปิดเผยอยู่ที่ประมาณ $102 ล้านดอลลาร์สหรัฐ ซึ่งลดลงจากข้อมูลสัปดาห์ที่แล้ว ($129.5 ล้านดอลลาร์สหรัฐ) เมื่อสัปดาห์ที่แล้ว โครงการที่ได้รับการลงทุนมากที่สุดคือบริษัทให้กู้ยืมคริปโต Morpho ($50 ล้านดอลลาร์สหรัฐ) รองลงมาคือโครงสร้างพื้นฐานการชำระเงินข้ามพรมแดน Layer 2 Financial ($10.7 ล้านดอลลาร์สหรัฐ) ต่อไปนี้คือกิจกรรมระดมทุนเฉพาะ (หมายเหตุ: 1. เรียงตามจำนวนเงินที่ประกาศ 2. ไม่รวมการระดมทุนและกิจกรรม MA 3. * หมายถึงบริษัทแบบดั้งเดิมที่มีธุรกิจเกี่ยวข้องกับบล็อคเชน): บริษัทให้กู้ยืมคริปโต Morpho เสร็จสิ้นการระดมทุนเชิงกลยุทธ์ $50 ล้านดอลลาร์สหรัฐ นำโดย Ribbit Capital เมื่อวันที่ 1 สิงหาคม…