Fontes & Referências

Para ir além do laboratório.

Esta é a biblioteca curada do MEL: 34 obras seminais que atravessam 122 anos de história da inteligência artificial, do nascimento da regressão estatística aos modelos de linguagem que moldam a década atual. Quando uma afirmação do site parecer surpreendente, a fonte original costuma estar aqui.

Estante editorial

Todas as obras, do mais recente ao seminal

34 obras curadas

Bubeck, S. et al.· 2023Paper
“Sparks of Artificial General Intelligence: Early experiments with GPT-4”
arXiv:2303.12712
Estudo da Microsoft Research que documenta capacidades emergentes do GPT-4 em tarefas que extrapolam a previsão do próximo token.
Transformers & LLMs
Touvron, H. et al.· 2023Paper
“Llama 2: Open Foundation and Fine-Tuned Chat Models”
arXiv:2307.09288
Referência para a família de modelos abertos da Meta, importante para entender a engenharia prática de LLMs fora dos laboratórios fechados.
Transformers & LLMs
Géron, A.· 2022Livro
“Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow”
O'Reilly (3ª ed.)
Ponte prática entre teoria e implementação; útil para testar os conceitos da trilha em código.
Aprendizado Supervisionado
Ouyang, L. et al.· 2022Paper
“Training language models to follow instructions with human feedback”
NeurIPS
InstructGPT: introduz o RLHF (reforço com feedback humano), técnica que tornou viáveis assistentes conversacionais como o ChatGPT.
Transformers & LLMs
James, G., Witten, D., Hastie, T., Tibshirani, R.· 2021Livro
“An Introduction to Statistical Learning”
Springer (2ª ed.)
Versão acessível do tratado anterior; ótima primeira leitura, com exercícios em R e Python e PDF aberto.
Aprendizado Supervisionado
Brown, T. B. et al.· 2020Paper
“Language Models are Few-Shot Learners”
NeurIPS
GPT-3: a escala de 175 bilhões de parâmetros revela comportamentos emergentes, como aprendizado em contexto a partir de poucos exemplos.
Transformers & LLMs
Devlin, J., Chang, M.-W., Lee, K., Toutanova, K.· 2018Paper
“BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding”
arXiv:1810.04805
Mostra o poder do Transformer para compreensão de linguagem, consolidando a abordagem encoder bidirecional pré-treinada e ajustada por tarefa.
Transformers & LLMs
Radford, A., Narasimhan, K., Salimans, T., Sutskever, I.· 2018Paper
“Improving Language Understanding by Generative Pre-Training”
OpenAI Technical Report
Conhecido como "GPT-1", apresenta o pré-treinamento generativo seguido de ajuste fino, linhagem direta dos LLMs decoder-only atuais.
Transformers & LLMs
Sutton, R. S., Barto, A. G.· 2018Livro
“Reinforcement Learning: An Introduction”
MIT Press (2ª ed.)
Referência fundamental e didática da área; PDF disponibilizado pelos autores. Se for ler um único livro sobre RL, este é o livro.
Aprendizado por Reforço
Schulman, J. et al.· 2017Paper
“Proximal Policy Optimization Algorithms”
arXiv:1707.06347
PPO, algoritmo amplamente usado em pesquisa e indústria, inclusive no ajuste fino de LLMs com RLHF.
Aprendizado por Reforço
Vaswani, A. et al.· 2017Paper
“Attention Is All You Need”
NeurIPS
Artigo fundador da arquitetura Transformer. Propõe um modelo baseado puramente em atenção, dispensando recorrência e convoluções, originalmente para tradução automática.
Transformers & LLMs
Goodfellow, I., Bengio, Y., Courville, A.· 2016Livro
“Deep Learning”
MIT Press
Tratado de referência sobre redes neurais profundas, com versão online gratuita autorizada pelos autores.
Deep Learning
He, K., Zhang, X., Ren, S., Sun, J.· 2016Paper
“Deep Residual Learning for Image Recognition”
CVPR
ResNet: introduz blocos residuais e viabiliza redes com centenas de camadas; padrão arquitetural até hoje.
Deep Learning
Silver, D. et al.· 2016Paper
“Mastering the game of Go with deep neural networks and tree search”
Nature, 529
AlphaGo: marco histórico em que reforço profundo combinado a busca em árvore vence campeões humanos no Go.
Aprendizado por Reforço
Bahdanau, D., Cho, K., Bengio, Y.· 2015Paper
“Neural Machine Translation by Jointly Learning to Align and Translate”
ICLR
Introduz o mecanismo de atenção em redes recorrentes; sem este artigo, não existiria o Transformer.
Transformers & LLMs
LeCun, Y., Bengio, Y., Hinton, G.· 2015Paper
“Deep Learning”
Nature, 521
Panorama assinado pelos três autores premiados com o Turing Award. Leitura curta e essencial.
Deep Learning
Mnih, V. et al.· 2015Paper
“Human-level control through deep reinforcement learning”
Nature, 518
DQN: combina Q-Learning com redes neurais profundas e abre a era moderna do RL aplicado a jogos e robótica.
Aprendizado por Reforço
Provost, F., Fawcett, T.· 2013Livro
“Data Science for Business”
O'Reilly
Leitura executiva sobre como problemas de negócio se traduzem em problemas de classificação e regressão.
Aprendizado Supervisionado
Krizhevsky, A., Sutskever, I., Hinton, G. E.· 2012Paper
“ImageNet Classification with Deep Convolutional Neural Networks”
NeurIPS
AlexNet: o resultado que populariza redes profundas modernas e dispara a revolução do Deep Learning na visão computacional.
Deep Learning
Hastie, T., Tibshirani, R., Friedman, J.· 2009Livro
“The Elements of Statistical Learning”
Springer (2ª ed.)
Referência canônica para regressão, classificação e teoria estatística do aprendizado supervisionado. PDF aberto pelos autores.
Aprendizado Supervisionado
Hastie, T., Tibshirani, R., Friedman, J.· 2009Livro
“The Elements of Statistical Learning, capítulo 14 (Unsupervised Learning)”
Springer (2ª ed.)
Tratamento estatístico rigoroso de clusterização, redução de dimensionalidade e métodos relacionados.
Aprendizado Não Supervisionado
Breiman, L.· 2001Paper
“Random Forests”
Machine Learning, 45(1)
Define formalmente as florestas aleatórias, o conjunto (ensemble) de árvores que se tornou ferramenta padrão de mercado.
Aprendizado Supervisionado
LeCun, Y. et al.· 1998Paper
“Gradient-based learning applied to document recognition”
Proceedings of the IEEE, 86(11)
Apresenta a LeNet-5, arquitetura convolucional que reconhece dígitos manuscritos e antecipa o CNN moderno.
Deep Learning
Hochreiter, S., Schmidhuber, J.· 1997Paper
“Long Short-Term Memory”
Neural Computation, 9(8)
LSTM: arquitetura recorrente que dominou modelagem de sequência por quase duas décadas, antes da era Transformer.
Deep Learning
Ester, M., Kriegel, H.-P., Sander, J., Xu, X.· 1996Paper
“A density-based algorithm for discovering clusters in large spatial databases with noise”
KDD
Introduz o DBSCAN, alternativa ao K-means que descobre clusters de formato arbitrário e detecta ruído naturalmente.
Aprendizado Não Supervisionado
Cortes, C., Vapnik, V.· 1995Paper
“Support-Vector Networks”
Machine Learning, 20(3)
Introduz as Support Vector Machines (SVM), uma das famílias clássicas de classificadores supervisionados.
Aprendizado Supervisionado
Watkins, C. J. C. H., Dayan, P.· 1992Paper
“Q-Learning”
Machine Learning, 8(3-4)
Artigo seminal que formaliza o Q-Learning, algoritmo central do simulador desta trilha.
Aprendizado por Reforço
Rousseeuw, P. J.· 1987Paper
“Silhouettes: A graphical aid to the interpretation and validation of cluster analysis”
Journal of Computational and Applied Mathematics, 20
Define o coeficiente de silhueta, métrica que aparece como critério clássico para julgar a qualidade de uma clusterização.
Aprendizado Não Supervisionado
Rumelhart, D. E., Hinton, G. E., Williams, R. J.· 1986Paper
“Learning representations by back-propagating errors”
Nature, 323
Artigo histórico que populariza o algoritmo de retropropagação, base do treinamento de redes profundas até hoje.
Deep Learning
Lloyd, S. P.· 1982Paper
“Least squares quantization in PCM”
IEEE Trans. on Information Theory, 28(2)
Variante do K-means que dá nome ao algoritmo iterativo padrão usado na maioria das implementações modernas.
Aprendizado Não Supervisionado
MacQueen, J.· 1967Paper
“Some methods for classification and analysis of multivariate observations”
Berkeley Symposium on Mathematical Statistics and Probability
Trabalho que cunha o termo "K-means" e formaliza o algoritmo de clusterização que você simula nesta trilha.
Aprendizado Não Supervisionado
Cox, D. R.· 1958Paper
“The regression analysis of binary sequences”
Journal of the Royal Statistical Society
Artigo seminal da Regressão Logística, apresentando a função sigmoide aplicada a dados binários.
Aprendizado Supervisionado
Bellman, R.· 1957Livro
“Dynamic Programming”
Princeton University Press
Introduz a equação de Bellman e o conceito de valor de estado, alicerce matemático de praticamente todo método de aprendizado por reforço.
Aprendizado por Reforço
Pearson, K.· 1901Paper
“On lines and planes of closest fit to systems of points in space”
Philosophical Magazine, 2(11)
Texto inaugural da Análise de Componentes Principais (PCA), técnica de redução de dimensionalidade companheira inseparável da clusterização.
Aprendizado Não Supervisionado