Seguiu endavant en ciències de la informació mitjançant l'aprenentatge d'un d'aquests idiomes lucratius
Això és precisament el que fan els científics de la informació: descobrir informació, fer connexions, crear visualitzacions de dades i ajudar a les empreses a operar de manera eficient.
I una comprensió profunda dels llenguatges de programació adequats és essencial per interpretar estadístiques i treballar amb bases de dades.
Segons KDnuggets, el 91% dels científics de dades utilitzen els quatre idiomes següents.
Idioma 1: R
R és un llenguatge orientat a l'estadística popular entre els miners de dades. És una implementació de codi obert i orientada a objectes de S, i no és massa difícil d'aprendre.
Si voleu aprendre a desenvolupar programari estadístic, R és un bon idioma per saber-ho. També us permet manipular i visualitzar gràficament les dades.
Com a part del seu programa d'especialització de Ciència de Dades, Coursera ofereix una classe en R que no només t'ensenya com programar en l'idioma sinó que també passa per aplicar-la en el context de la ciència / anàlisi de dades.
Idioma 2: SAS
Igual que R, SAS s'utilitza principalment per a l'anàlisi estadística. És una poderosa eina per transformar les dades de bases de dades i fulls de càlcul en formats llegibles (com ara documents HTML i PDF), així com les taules i gràfics més visuals.
Originalment desenvolupat per investigadors acadèmics, s'ha convertit en una de les eines d'anàlisi més populars a nivell mundial per a empreses i organitzacions de tot tipus. És més d'un gran tipus de programari corporatiu i no sol ser utilitzat per empreses més petites o persones que treballen per compte propi.
Els recursos per aprendre SAS estan llistats en aquest document .
El llenguatge no és de codi obert, pel que probablement no podreu ensenyar-vos de forma gratuïta.
Idioma 3: Python
Encara que R i SAS es consideren més com "els dos grans" al món analític, Python s'ha convertit recentment en un contendent. Una de les seves principals avantatges és la seva àmplia varietat de biblioteques (per exemple, Pandas, NumPy, SciPi, etc.) i funcions estadístiques.
Ja que Python (com R) és un llenguatge de codi obert, s'hi afegeixen actualitzacions ràpidament. (Amb els programes adquirits com SAS, heu d'esperar a la versió de la propera versió.)
Un altre factor a tenir en compte és que Python és potser el més fàcil d'aprendre, per la seva simplicitat i la gran disponibilitat de cursos i recursos sobre ella. Aquest lloc web és un gran lloc per començar.
També podeu trobar una llista més completa de materials d'aprenentatge de Python aquí.
Llengua 4: SQL
Fins ara hem estat mirant idiomes que pertanyen a la mateixa família i (més o menys) tenen les mateixes funcions. SQL, que significa "Llenguatge de consulta estructurada", és on canvia. Aquest idioma no té res a veure amb les estadístiques; se centra en el maneig de la informació en bases de dades relacionals.
És el llenguatge de base de dades més utilitzat i és de codi obert, de manera que els científics de dades esperen definitivament no haurien de saltar.
L'aprenentatge SQL hauria d'equipar-vos per crear bases de dades SQL, gestionar les dades dins d'ells i utilitzar funcions rellevants. Udemy ofereix un curs de formació que abasta tots els conceptes bàsics i es pot completar amb força rapidesa i sense dolor.
Conclusió
Com a mínim, probablement hauríeu d'aprendre SQL i triar almenys un dels idiomes d'estadístiques. Però si teniu temps (i, en el cas de SAS, els diners) i voleu fer-vos realitat la seva comercialització, no hi ha res a dir que no podeu aprendre els quatre!
No us apresureu, obteniu molta pràctica, perfeccioneu les vostres habilitats i gaudiu de la seguretat laboral.