CoreThink là một lớp suy luận tiên tiến được xây dựng trên một phương pháp suy luận mới gọi là General Symbolics. Nó khác với các mô hình suy luận hiện có như điều chỉnh theo thời gian kiểm tra, tinh chỉnh có giám sát (SFT) và học tăng cường với phần thưởng có thể xác minh (RLVR). CoreThink General Symbolic Reasoner (GSR) được cấu trúc xung quanh ba trường hợp sử dụng chính: gọi công cụ, tạo mã và lập kế hoạch, và thể hiện hiệu suất vượt trội trên bảy điểm chuẩn trong mỗi miền. Cụ thể, nó đạt được điểm hiệu suất tiên tiến (SOTA) là 66,66% trên Livecodebench v6, 89% trên Instruction-Following Evals và 24,4% trên ARC-AGI-2. Hơn nữa, chúng tôi trình bày một IDE mã hóa tác nhân được phát triển bằng cách sử dụng các nguyên tắc của General Symbolics, đạt được độ chính xác tiên tiến là 62,3% trên SWE-Bench Lite. Cải tiến hiệu suất này đạt được mà không cần bất kỳ chi phí tinh chỉnh hoặc đào tạo nào. Lớp suy luận CoreThink được thiết kế để mang lại hiệu suất thuần túy, đảm bảo độ chính xác của các tác vụ suy luận của mô hình không bao giờ bị suy giảm. Các tác giả lập luận rằng các phương pháp hiện tại cuối cùng sẽ dẫn đến hiệu suất LLM giảm dần, đòi hỏi phải phát triển các kỹ thuật suy luận mới. Báo cáo kỹ thuật này trình bày chi tiết về phương pháp CoreThink ở cấp độ cao và tính khả dụng của các mô hình CoreThink cho các trường hợp sử dụng suy luận chuyên sâu.