Data Scientist · Economist · Builder

Data Scientist · Économiste · Bâtisseur

Paul Mbwase

Building systems that make data useful

Construire des systèmes qui rendent les données utiles

I build end-to-end data pipelines, predictive models, and production APIs — combining statistical rigour from econometrics and actuarial science with modern software engineering. Currently based in Montréal, open to exciting new challenges.

Je construis des pipelines de données de bout en bout, des modèles prédictifs et des APIs en production — combinant la rigueur statistique de l'économétrie et des sciences actuarielles avec l'ingénierie logicielle moderne. Basé à Montréal, ouvert à de nouveaux défis stimulants.

11k+ Real estate listings scraped & modelled Annonces immobilières extraites et modélisées
4 End-to-end production systems built Systèmes de production construits de bout en bout
3+ Years applied research & teaching Ans de recherche appliquée et d'enseignement
01

About

À propos

I am a data scientist and economist with a background spanning statistical consulting, academic research, and software engineering. I work at the intersection of rigorous quantitative methods and production-grade systems — building things that don't just analyse data, but deliver it reliably at scale.

Je suis data scientist et économiste avec une expérience en conseil statistique, recherche académique et ingénierie logicielle. Je travaille à l'intersection des méthodes quantitatives rigoureuses et des systèmes en production — construisant des choses qui non seulement analysent les données, mais les livrent de manière fiable à grande échelle.

My work combines econometric impact evaluation, machine learning, and full-stack data engineering. I design database schemas, build scraping pipelines, train predictive models, and deploy APIs — handling the complete arc from raw data to production endpoint.

Mon travail combine l'évaluation d'impact économétrique, l'apprentissage automatique et l'ingénierie de données full-stack. Je conçois des schémas de bases de données, construis des pipelines de scraping, entraîne des modèles prédictifs et déploie des APIs — gérant l'arc complet depuis la donnée brute jusqu'à l'endpoint en production.

I am an engineer and puzzle-lover — in search of stimulating challenges that push both analytical and technical limits.

Je suis ingénieur et amoureux de puzzles — à la recherche de défis stimulants qui repoussent à la fois les limites analytiques et techniques.

Currently
Actuellement
Research assistant at UQÀM — policy evaluation using administrative microdata (CIQSS). Teaching econometrics at undergraduate and graduate level.
Assistant de recherche à l'UQÀM — évaluation de politiques publiques avec des microdonnées administratives (CIQSS). Enseignement de l'économétrie aux niveaux bac et maîtrise.
Approach
Approche
End-to-end ownership — from schema design and data collection through modelling, API design, and self-hosted production deployment.
Responsabilité de bout en bout — de la conception du schéma et la collecte de données jusqu'à la modélisation, la conception d'API et le déploiement en production auto-hébergé.
Looking for
Je recherche
An exciting new project — data engineering, applied ML, or quantitative research roles where rigour and engineering depth both matter.
Un nouveau projet excitant — ingénierie de données, ML appliqué ou rôles de recherche quantitative où la rigueur et la profondeur technique comptent toutes les deux.
02

Skills & Tools

Compétences & Outils

Programming
Programmation
  • Python
  • R
  • SQL
  • Matlab
  • SAS
Data Engineering
Ingénierie de Données
  • PostgreSQL
  • SQLAlchemy
  • Alembic
  • Playwright
  • FastAPI
  • Pandas
Machine Learning
Apprentissage Automatique
  • Scikit-learn
  • XGBoost
  • SHAP
  • Statsmodels
  • Plotly / Dash
Infrastructure
Infrastructure
  • Linux / Ubuntu
  • Docker
  • Nginx
  • Cloudflare
  • Git
  • systemd
Statistical Methods
Méthodes Statistiques
  • Econometrics
  • Économétrie
  • Impact Evaluation
  • Évaluation d'impact
  • Time Series
  • Séries temporelles
  • Causal Inference
  • Inférence causale
BI & Reporting
BI & Reporting
  • Tableau
  • Power BI
  • Stata
  • SPSS
03

Projects

Projets

Live En ligne
Backend · DevOps
Backend · DevOps
Social Media API
API Réseaux Sociaux

RESTful API deployed on a self-hosted Ubuntu server behind Nginx and Cloudflare Tunnel — no cloud provider, no port forwarding. A hands-on exploration of production server management, process supervision, and zero-trust networking.

API RESTful déployée sur un serveur Ubuntu auto-hébergé derrière Nginx et Cloudflare Tunnel — sans fournisseur cloud, sans redirection de ports. Une exploration pratique de la gestion de serveurs en production et des réseaux zero-trust.

FastAPI Gunicorn Nginx Cloudflare Tunnel systemd
In development En développement
Actuarial Science · Statistics
Sciences Actuarielles · Statistiques
Actuarial Models
Modèles Actuariels

Mortality tables, claims reserving, and insurance pricing models — applying the same end-to-end pipeline discipline to actuarial science problems. Coming next.

Tables de mortalité, provisionnement de sinistres et modèles de tarification — appliquant la même discipline de pipeline de bout en bout aux problèmes des sciences actuarielles. À venir.

R Python SAS