<aside> 💡 QANDA, công ty nền tảng giáo dục hàng đầu châu Á, đã phát triển MathGPT, 1 mô hình ngôn ngữ lớn (LLM) chuyên ngành toán học dựa trên dữ liệu và công nghệ toán học được tích lũy qua nhiều năm. Nó cho thấy hiệu suất vượt trội hơn Tora của Microsoft, người giữ kỷ lục trước đó về các tiêu chuẩn đánh giá khả năng toán học như MATH (12.500 bài toán trung học) và GSM8K (8.500 bài toán cấp tiểu học), trở thành sản phẩm tốt nhất trong số các mô hình dưới 13B. Trong tương lai, chúng tôi dự định sẽ nâng cao hơn nữa độ chính xác của MathGPT và nâng cao mô hình bằng cách mở rộng nó sang nhiều ngôn ngữ khác nhau, tích hợp mô hình này vào các sản phẩm của chúng tôi và cung cấp nó cho các doanh nghiệp cần các giải pháp LLM chuyên biệt cho giáo dục.

</aside>

Chi tiết

Phương pháp phát triển

Chúng tôi đã phát triển MathGPT bằng cách sử dụng phương pháp tập trung vào dữ liệu và đạt được hiệu suất tốt nhất (SOTA).

Đánh giá hiệu suất

Để đánh giá hiệu suất của MathGPT, QANDA đã sử dụng nhiều bộ dữ liệu khác nhau, bao gồm MATH và GSM8K, thường được sử dụng để đánh giá khả năng giải toán của các mô hình học máy. Chúng khác nhau về loại và mức độ khó của các bài toán. Bộ dữ liệu MATH bao gồm đại số, lý thuyết số, xác suất và hình học ở cấp trung học, và GSM8K bao gồm các bài toán đố ở cấp tiểu học và trung học cơ sở. MathGPT hoạt động tốt hơn các mô hình hiện có trên tất cả các tập dữ liệu được đánh giá. Điều này chứng tỏ MathGPT có khả năng giải quyết vấn đề xuất sắc trong nhiều lĩnh vực toán học.

https://prod-files-secure.s3.us-west-2.amazonaws.com/f0e6f6cf-daae-448c-965d-74cfdd516917/37bd38d6-0e0f-4a05-832b-3fed70a815fe/Untitled.png

https://prod-files-secure.s3.us-west-2.amazonaws.com/f0e6f6cf-daae-448c-965d-74cfdd516917/fe0d0bc8-3bf2-46d9-bea7-ffeb61da06e5/Untitled.png

Ghi chú

Một bài viết về các khía cạnh kỹ thuật của MathGPT hiện đang được xem xét để xuất bản.

Mục tiêu phát triển trong tương lai

Mathpresso có kế hoạch liên tục nâng cao độ chính xác cũng như hiệu suất của mô hình 'MathGPT' và cuối cùng tích hợp nó vào các sản phẩm học tập của mình với tư cách là gia sư AI. Bằng cách giới thiệu dịch vụ gia sư AI này cho tất cả các trang web giáo dục và giải pháp giáo dục, chúng tôi mong muốn đạt được sự đổi mới với tư cách là gia sư AI toàn cầu trong thị trường giáo dục.

Ngoài ra, Mathpresso đang có kế hoạch phát triển MathGPT cho các ngôn ngữ khác. Phiên bản hiện tại của MathGPT chỉ được đào tạo với bộ dữ liệu tiếng Anh, nhưng chúng tôi có kế hoạch mở rộng hỗ trợ sang nhiều ngôn ngữ khác nhau trong tương lai bằng cách sử dụng dữ liệu toán học khổng lồ đa ngôn ngữ của QANDA.

MathGPT sẽ được cung cấp cho nhiều khách hàng khác nhau, bao gồm cả các nhà phát triển dịch vụ giáo dục. Hơn nữa, chúng tôi cũng sẵn sàng hợp tác trong các dự án nghiên cứu chung nhằm cải thiện hiệu suất và khả năng ứng dụng Mô hình ngôn ngữ lớn trong giáo dục.