กลุ่มภาษาโตคาเรียน หรือ ภาษาโตชาเรียน เป็นภาษาตระกูลอินโด-ยุโรเปียน แบ่งเป็นภาษาย่อยได้สองภาษาคือ ภาษาโตคาเรียนตะวันออกและโตคาเรียนตะวันตก ใช้พูดในพุทธศตวรรษที่ 11 – 13 ก่อนจะกลายเป็นภาษาตาย ผู้พูดภาษานี้หันไปพูดภาษาอุยกูร์ ทั้งสองภาษาใช้พูดในบริเวณแอ่งตาริมในเอเชียกลาง ปัจจุบันอยู่ในมณฑลซินเจียง ประเทศจีน ชื่อของภาษานี้มาจาก โตคาเรียน นักประวัติศาสตร์ชาวกรีก ชื่อของภาษานี้ในภาษาโตคาเรียนคือ arish- k?na
ภาษาโตคาเรียน เอหรือโตคาเรียนตะวันออก นั้น เคยพูดกันในแถบเตอร์ฟาน ซึ่งอยู่ทางตะวันออก ส่วนภาษาโตคาเรียน บีหรือโตคาเรียนตะวันตก นั้น เคยพูดกันส่วนใหญ่ในแถบคูชา ทางตะวันตก แต่ก็มีพูดกันในเตอร์ฟานด้วย ภาษาโตคาเรียนนั้นเขียนด้วยอักษรที่ดัดแปลงจากอักษรอินเดียฝ่ายเหนือ เรียกว่าอักษรพราหมี ซึ่งเป็นอักษรที่เคยใช้เขียนภาษาสันสกฤตในภูมิภาคนี้ด้วยเช่นกัน
แม้ว่าภาษาโตคาเรียนจะเป็นภาษาที่เก่าแก่ แต่นักวิชาการเพิ่งรู้จักและได้วิเคราะห์ไวยากรณ์ รวมทั้งแปลภาษาโตคาเรียนได้เป็นครั้งแรก เมื่อ ค.ศ. 1908 นี้เอง โดยนักวิชาการชาวเยอรมัน ชื่อ เอมิล ซีก (Emil Sieg) และวิลเฮล์ม ซีกลิง (Wilhelm Siegling) ทั้งนี้ได้มีการเสนอชื่อเรียกภาษาตามสำเนียงเยอรมันว่า โตคาริช (Tocharisch)
ภาษาโตคาเรียนเป็นสาขาหนึ่งของกลุ่มภาษาอินโด-ยูโรเปียน แต่ไม่มีความสัมพันธ์กับสาขาย่อยอินโด-อารยัน หรืออินโด-อิเรเนียน ทั้งๆ ที่อยู่ในพื้นที่ทางตะวันออก หากพิจารณาตามหลักสัทศาสตร์แล้ว ภาษาโตคาเรียนอยู่ในกลุ่มเคนตุม (Centum) อันเป็นเกณฑ์คร่าวๆ ในการจำแนกกลุ่มภาษาอินโด-ยูโรเปียน ทั้งๆ ที่กลุ่มภาษาเคมตุมนั้น ส่วนใหญ่จะอยู่ในทวีปยุโรป จึงจัดว่าภาษาโตคาเรียนเป็นกลุ่มภาษาเคมตุม ที่รายล้อมด้วยกลุ่มภาษาซาเตม (Satem) ในทวีปเอเชีย และมีคุณลักษณะบางประการที่คล้ายคลึงกับภาษาฮิตไตต์ที่เคยพูดกันเมื่อราว 1,100 ปีก่อนคริสตกาล