A medida que aumenta la comprensión del autismo y el capacitismo, también aumenta la comprensión del lenguaje capacitista asociado con el autismo. Este lenguaje presenta desafíos significativos para la investigación en PNL debido a su naturaleza matizada y dependiente del contexto. Sin embargo, la detección del lenguaje capacitista antiautista sigue siendo un área inexplorada, y las herramientas de PNL existentes a menudo no logran capturar sus expresiones sutiles. En este artículo, abordamos esta brecha crítica presentando AUTALIC, el primer conjunto de datos de referencia dedicado a la detección de lenguaje capacitista antiautista en contexto. Este conjunto de datos consta de 2400 oraciones relacionadas con el autismo y su contexto, recopiladas de Reddit, anotadas por expertos con experiencia en neurodiversidad. Evaluaciones exhaustivas demuestran que los modelos lingüísticos actuales, incluyendo los LLM de vanguardia, tienen dificultades para identificar de forma fiable el capacitismo antiautista y coincidir con el juicio humano, lo que pone de relieve las limitaciones en este ámbito. Al publicar AUTALIC, junto con sus anotaciones individuales, ofrecemos un recurso valioso para los investigadores que estudian el capacitismo, la neurodiversidad y la discrepancia en los esfuerzos de anotación. Este conjunto de datos representa un paso importante hacia el desarrollo de sistemas de PNL más completos y contextualizados que reflejen mejor las diversas perspectivas.