Skip to content

JonasSouza871/Machine-Learning-Statistics-Studies

Repository files navigation

Machine Learning & Statistics Studies


English

Overview

A comprehensive collection of Machine Learning, Statistics, and Mathematical Modeling studies using Python. This repository showcases practical implementations of statistical concepts, mathematical foundations, and machine learning algorithms essential for data science applications.

Repository Structure

Machine-Learning-Statistics-Studies/
│
├── 01_Fundamentals/              # Python, Pandas, and Statistical Basics
│   ├── Python_for_Data_Science/  # Python fundamentals for DS
│   ├── Pandas/                   # Data manipulation with Pandas
│   └── Statistics/               # Basic statistical concepts
│
├── 02_Mathematics/               # Mathematical Foundations
│   ├── Calculus/                 # Limits, derivatives, and ML calculus
│   └── Statistics/               # Probability, sampling, and analysis
│
├── 03_Machine_Learning/          # Classical ML Algorithms
│   ├── Classification/           # Classification algorithms (Scikit-learn)
│   ├── Decision_Trees/           # Decision tree implementations
│   └── Regression/               # Linear regression models
│
├── 04_Deep_Learning/             # Neural Networks
│   └── Activation_Functions/     # ReLU, Sigmoid, Tanh, Softmax
│       ├── exercises/            # Practice exercises
│       └── summaries/            # Theory summaries
│
├── 05_Statistical_Analysis/      # Advanced Statistical Methods
│   ├── Hypothesis_Testing/       # Statistical hypothesis testing
│   └── Regression_Analysis/      # Correlation and advanced regression
│
└── 06_Projects/                  # Complete Projects
    └── Medical_Costs_Regression/ # Medical costs prediction project

Key Features

Fundamentals

  • Python for Data Science basics
  • Pandas data manipulation and analysis
  • Descriptive and frequency statistics

Mathematics

  • Calculus for Machine Learning (limits, derivatives)
  • Probability theory and sampling techniques
  • Experimental design and data analysis

Machine Learning

  • Classification: Scikit-learn implementations
  • Decision Trees: Tree-based algorithms
  • Regression: Linear and multivariate models

Deep Learning

  • Activation functions (ReLU, Sigmoid, Tanh, Softmax)
  • Implementation and mathematical analysis
  • Comprehensive exercises and summaries

Statistical Analysis

  • Hypothesis testing methodologies
  • Correlation and regression analysis
  • Advanced regression techniques
  • Predictive modeling

Projects

  • Medical Costs Regression: Complete regression analysis project predicting medical costs using multiple regression techniques

Technologies & Libraries

Category Tools
Language Python 3.x
Environment Jupyter Notebook
Data Manipulation Pandas, NumPy
Visualization Matplotlib, Seaborn, Plotly
Machine Learning Scikit-learn
Statistics SciPy, Statsmodels

Learning Outcomes

  • Statistical Analysis: Proficiency in descriptive and inferential statistics
  • Mathematical Modeling: Calculus and linear algebra for ML
  • Data Visualization: Creating insightful and professional visualizations
  • Machine Learning: Implementation of classification, regression, and tree-based models
  • Deep Learning Foundations: Understanding neural network components
  • Hypothesis Testing: Statistical validation and decision-making
  • Project Development: End-to-end ML project implementation

Installation & Usage

# Clone the repository
git clone https://github.com/yourusername/Machine-Learning-Statistics-Studies.git

# Navigate to the directory
cd Machine-Learning-Statistics-Studies

# Install dependencies
pip install -r requirements.txt

# Launch Jupyter Notebook
jupyter notebook

License

This project is licensed under the MIT License - see the LICENSE file for details.

Contributing

Contributions, issues, and feature requests are welcome! Feel free to check the issues page.


Português

Visão Geral

Uma coleção abrangente de estudos em Machine Learning, Estatística e Modelagem Matemática usando Python. Este repositório apresenta implementações práticas de conceitos estatísticos, fundamentos matemáticos e algoritmos de machine learning essenciais para aplicações em ciência de dados.

Estrutura do Repositório

Machine-Learning-Statistics-Studies/
│
├── 01_Fundamentals/              # Python, Pandas e Estatística Básica
│   ├── Python_for_Data_Science/  # Fundamentos de Python para DS
│   ├── Pandas/                   # Manipulação de dados com Pandas
│   └── Statistics/               # Conceitos estatísticos básicos
│
├── 02_Mathematics/               # Fundamentos Matemáticos
│   ├── Calculus/                 # Limites, derivadas e cálculo para ML
│   └── Statistics/               # Probabilidade, amostragem e análise
│
├── 03_Machine_Learning/          # Algoritmos Clássicos de ML
│   ├── Classification/           # Algoritmos de classificação (Scikit-learn)
│   ├── Decision_Trees/           # Implementações de árvores de decisão
│   └── Regression/               # Modelos de regressão linear
│
├── 04_Deep_Learning/             # Redes Neurais
│   └── Activation_Functions/     # ReLU, Sigmoid, Tanh, Softmax
│       ├── exercises/            # Exercícios práticos
│       └── summaries/            # Resumos teóricos
│
├── 05_Statistical_Analysis/      # Métodos Estatísticos Avançados
│   ├── Hypothesis_Testing/       # Testes de hipóteses estatísticas
│   └── Regression_Analysis/      # Correlação e regressão avançada
│
└── 06_Projects/                  # Projetos Completos
    └── Medical_Costs_Regression/ # Projeto de predição de custos médicos

Principais Características

Fundamentos

  • Introdução ao Python para Ciência de Dados
  • Manipulação e análise de dados com Pandas
  • Estatística descritiva e de frequências

Matemática

  • Cálculo para Machine Learning (limites, derivadas)
  • Teoria de probabilidade e técnicas de amostragem
  • Desenho experimental e análise de dados

Machine Learning

  • Classificação: Implementações com Scikit-learn
  • Árvores de Decisão: Algoritmos baseados em árvores
  • Regressão: Modelos lineares e multivariados

Deep Learning

  • Funções de ativação (ReLU, Sigmoid, Tanh, Softmax)
  • Implementação e análise matemática
  • Exercícios e resumos completos

Análise Estatística

  • Metodologias de testes de hipóteses
  • Análise de correlação e regressão
  • Técnicas avançadas de regressão
  • Modelagem preditiva

Projetos

  • Regressão de Custos Médicos: Projeto completo de análise de regressão para predição de custos médicos usando múltiplas técnicas de regressão

Tecnologias & Bibliotecas

Categoria Ferramentas
Linguagem Python 3.x
Ambiente Jupyter Notebook
Manipulação de Dados Pandas, NumPy
Visualização Matplotlib, Seaborn, Plotly
Machine Learning Scikit-learn
Estatística SciPy, Statsmodels

Resultados de Aprendizagem

  • Análise Estatística: Proficiência em estatística descritiva e inferencial
  • Modelagem Matemática: Cálculo e álgebra linear para ML
  • Visualização de Dados: Criação de visualizações profissionais e informativas
  • Machine Learning: Implementação de modelos de classificação, regressão e árvores
  • Fundamentos de Deep Learning: Compreensão de componentes de redes neurais
  • Testes de Hipóteses: Validação estatística e tomada de decisão
  • Desenvolvimento de Projetos: Implementação completa de projetos de ML

Instalação & Uso

# Clone o repositório
git clone https://github.com/seuusuario/Machine-Learning-Statistics-Studies.git

# Navegue até o diretório
cd Machine-Learning-Statistics-Studies

# Instale as dependências
pip install -r requirements.txt

# Inicie o Jupyter Notebook
jupyter notebook

Licença

Este projeto está licenciado sob a Licença MIT - veja o arquivo LICENSE para detalhes.

Contribuindo

Contribuições, issues e solicitações de recursos são bem-vindos! Sinta-se à vontade para verificar a página de issues.


Repository Organization

About

Repository where I store my Python study files for machine learning and statistical analysis

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published