Trong nhiều năm, lĩnh vực Trí tuệ nhân tạo (AI) thường gắn liền với quan điểm rằng các mô hình càng lớn thì hiệu quả càng cao. Khái niệm Mô hình ngôn ngữ lớn (LLM) phản ánh rõ điều này khi các hệ thống được đánh giá dựa trên quy mô hàng chục hoặc hàng trăm tỷ tham số. Tuy nhiên, trong bối cảnh sản xuất hiện đại, nơi yêu cầu về độ trễ thấp, chi phí hợp lý, độ tin cậy và khả năng tích hợp hệ thống ngày càng quan trọng, xu hướng “AI thu nhỏ” đang nổi lên như một giải pháp tối ưu hơn cho nhiều ứng dụng công nghiệp.