¿Cuáles son los mejores guiones R que has escrito?

Trabajo en encuestas de satisfacción del cliente y, por lo tanto, manejo una gran cantidad de datos en varias dimensiones (áreas de preguntas y preguntas secundarias). He trabajado con el guión durante los últimos tres años. Los estudios siguen la misma estructura.

El guión en realidad consiste en varios guiones (guión 1, guión 2 y una variedad de funciones). Entonces, con el script, simplemente importo los datos, establezco los nombres de las preguntas y subconsultas utilizadas y los argumentos para la función principal (script 2). Script 2 produce un montón de gráficos en el disco duro y realiza algunos análisis. También maneja respuestas de texto que se guardan en un documento de Word. El nombre de la empresa y los números de los análisis se almacenan en documentos de texto separados.

También he desarrollado una plantilla de diseño que importa los gráficos y los documentos de texto. El texto se coloca utilizando el flujo de palabras del complemento. De esta manera puedo producir un análisis e informe en unos 10 minutos en lugar de 8 horas 🙂

He estado trabajando en un proyecto de investigación en el que estamos rastreando los comportamientos de las personas con los teléfonos celulares. Hemos estado haciendo esto durante aproximadamente 4 años, y cuando comencé, debido al legado institucional, la mayor parte del código original fue escrito usando STATA para hacer toda la gestión de datos. Este no es un lenguaje de programación real y todo el proceso de administración de datos en él fue terrible y complicó cada paso del proyecto. Hace unos 6 meses, finalmente abandonamos STATA para R, y todo cambió.

He estado programando durante más de 15 años, y he tenido experiencia en una variedad de idiomas, pero ser forzado a un lenguaje muy restrictivo y finalmente poder desarrollar usando un lenguaje muy flexible ha transformado completamente mi metodología de codificación. El código que estoy escribiendo ahora se está escribiendo para los próximos 5 años, no para las próximas 2 semanas. Tengo el conocimiento y la capacidad para hacerlo, porque he pasado mucho tiempo familiarizándome con el tipo de datos que estoy usando: cómo está estructurado, cuáles son sus problemas y cómo puedo realizar varios trucos de programación para obtener Resultados que quiero. Ser forzado a un lenguaje muy primitivo me hizo familiarizarme con todos los entresijos de los datos y cómo lograr la mayoría de mis resultados a través de métodos de fuerza bruta feos. R simplemente hizo todo mucho más sencillo y menos hackeo inteligente.

Pasar a R, que es mucho más parecido a un lenguaje tradicional, me ha permitido escribir código que se acerca a los datos de una manera mucho más abstracta, separando completamente el código de los datos, lo que realmente no era posible en STATA. Si bien tuve que recrear todo desde cero, y esto ha llevado algo de tiempo, ese largo período de sufrimiento ha llevado a un código increíblemente flexible y confiable, y reproduce exactamente las mismas medidas y análisis que había creado para los datos originales.

Esto ha abierto un mundo de posibilidades. El código que estoy usando ahora es una herramienta más que un medio para un fin, que continuaré refinando y usando en el futuro. Mientras que en el pasado, sentía que los resultados eran el aspecto más interesante y más importante de mi trabajo, pero ya no. Creo que esta herramienta que estoy creando, y su capacidad para reproducir el mismo tipo de salida para una variedad de fuentes de datos, es mucho más valiosa. Esto me ha permitido alejar mi atención de estos datos específicos y comenzar a explorar cómo crear los mismos datos en otro lugar. Tener esta confianza en mi código me ha dado una gran confianza en lo que es posible.

Y eso es genial.

Hasta la fecha … aún más mejoras y desarrollo en el proceso … aunque no revela el código fuente.

Diseño óptico, análisis y optimización de una lente de litografía de nanofabricación.

Solo una parte de la interfaz de usuario (que se representa con javascript)