Edoardo Barp,卢森堡市的开发商
Edoardo is available for hire
Hire Edoardo

Edoardo Barp

Verified Expert  in Engineering

数据科学家和后端开发人员

Location
卢森堡市,卢森堡
至今成员总数
August 29, 2022

Edoardo是一位非常有成就的数据科学家,拥有强大的软件开发背景, 专注于通过R驱动创新&D项目、自动化和人工智能. 拥有成功领导多家早期创业公司的良好记录, Edoardo拥有引导项目从概念到无缝实现的独特能力.

Portfolio

Calensync.live
React, AWS CloudFront, AWS Lambda, Google API, Python, FastAPI, PostgreSQL...
Opali Analytics
Rust, Python 3, AWS Lambda, AWS CloudFormation, TypeScript, Webpack, Bootstrap...
Occam AI Inc.
Python,机器学习,数据工程,大型语言模型(LLMs)

Experience

Availability

Part-time

首选的环境

Linux, Python 3, Rust, Neo4j, PyCharm, Docker, Scikit-learn, PyTorch, 亚马逊网络服务(AWS), Apollo Server

The most amazing...

...project I've led, researched, 并实现了一个基于ml的解决方案,能够以每秒5GB的速度检测原始数据中的shellcode网络攻击.

Work Experience

完整的开发人员

2023 - PRESENT
Calensync.live
  • 使用React和Python/FastAPI创建网站的前端和后端.
  • 开发日历同步算法,并与Google API和webhooks集成.
  • Integrated Paddle.带有订阅机制的Com支付提供商.
技术:反应, AWS CloudFront, AWS Lambda, Google API, Python, FastAPI, PostgreSQL, Paddle, API Development, Unit Testing, Pytest, Project Management

Founder

2023 - PRESENT
Opali Analytics
  • 设计了一个DynamoDB数据库,以支持极其快速和负担得起的分析事件.
  • 在AWS上用Python开发了一个REST API (Lambda), API网关)处理所有与用户相关的请求:支付, website management, and dashboard.
  • 使用Bootstrap和TypeScript设计并开发了一个仪表板.
  • 在Rust中开发事件处理,减少延迟.
Technologies: Rust, Python 3, AWS Lambda, AWS CloudFormation, TypeScript, Webpack, Bootstrap, Amazon DynamoDB, FastAPI, Full-stack, ChatGPT, API Development, Unit Testing, Pytest

Python Developer

2024 - 2024
Occam AI Inc.
  • 在自动化框架中设计并实现了多个集成工具, 让人工智能与它们互动.
  • 做了几个重构决策来改进框架, 极大地简化了开发过程.
  • 为所有集成工具编写单元测试,以避免引入bug, 哪一个允许无缝重构.
  • 对类似的解决方案进行基准测试,并撰写一份关于如何在竞争中获得最佳优势的报告.
  • 集成多个客户端的LLM api,自动为任务获得最佳LLM选择.
技术:Python,机器学习,数据工程,大型语言模型(LLMs)

数据工程师和科学家

2023 - 2023
NDA
  • 开发了一个数据管道,从refintive API获取信息并进行处理.
  • 创建了一个分析管道来跟踪市场异常并触发警报.
  • 收集有关公司网站的信息,使用GPT创建自定义报告.
技术:精确的API, Python 3, Python, Pandas, Data Science, Data Visualization, Scraping, GPT, Unit Testing, Databricks, Pytest, Software QA

Neo4j Cypher查询开发者

2023 - 2023
Public Defence
  • 接管了一个废弃的仓库并更新了所有过时的协议.
  • 编写一个最佳的数据管道,在不到一天的时间内处理1tb的数据(以前的版本需要几个月的时间).
  • 创建复杂的数据分析Neo4j Cypher查询,以检测欺诈性区块链交易.
  • 创建复杂的Neo4j Cypher查询来跟踪交易资金流,并提供分析来证明接收钱包的所有权.
技术:Neo4j, Cypher, Graph Databases, Python, Blockchain, Bitcoin, Data Science, Data Engineering, Software QA

云和Neo4j开发人员

2022 - 2023
Amara
  • 实现多个可靠智能合约来处理拍卖机制, sponsoring, 和一般的NFT交流.
  • 构建Google云平台的容器化部署流程.
  • 利用图论和机器学习为用户实现了一个社会化推荐系统.
  • 实现和维护Neo4j/GraphQL API,包括编写多个自定义函数.
技术:Neo4j, GraphQL, Apollo Server, Node.js, Cypher, Docker, 谷歌云平台(GCP), Solidity, API Integration, Web Servers, Cloud Deployment, OpenAI GPT-3 API, Software, 软件开发, API Development, Data Engineering, Software QA

首席技术官

2020 - 2022
X80 Security
  • 创建了一个基于api的自动代理,不断地从客户端数据源提取数据, such as AWS, Azure, 谷歌云平台, GitHub, 和谷歌工作空间, 进入我们的存储等待处理.
  • 在Neo4j上设计并实现了图形结构来加载客户端的数据, 包括基础设施, assets, users, and permissions. 它允许团队分析复杂的关系并发现安全漏洞.
  • 概述并开发了上述图表的框架, 允许开发人员和数据科学家轻松扩展结构并添加新的分析模型以进行持续改进.
  • 创建在客户的AWS和GCP云上运行的自动漏洞扫描程序,以分析其实例并持续报告任何新问题.
  • 管理整个项目, 从构思到部署在多个企业客户端的完全工作的生产软件.
  • 设计带有里程碑的详细路线图,并在内部授权, 以及外部, when needed. 监督整个执行过程.
  • 设计系统以保护具有特殊合规性需求的数据,例如HIPAA和GDPR. 开发了一种机制来检测潜在的泄漏并防止它们发生.
技术:产品策略, 竞争战略, Product Management, Data Science, Team Management, Graph Theory, Roadmaps, Neo4j, Python, REST APIs, AWS Lambda, 亚马逊网络服务(AWS), AWS CloudFormation, Architecture, Enterprise Systems, APIs, Web Development, GraphQL, Cypher, Airtable, Amazon CloudFront CDN, Linux Servers, NGINX, Amazon S3 (AWS S3), SQL, Amazon EC2, SaaS, B2B, GitHub, API Integration, Web Servers, Cloud Deployment, Azure, 系统架构, Software, CTO, Venture Funding, Venture Capital, 软件开发, API Development, Data Engineering, Unit Testing, 抽象语法树(AST), Pytest, pylint, ANTLR, Code Review, Source Code Review, Software QA, Project Management

VP of Engineering

2019 - 2020
X80 Security
  • 在Rust中研发基于机器学习的高性能软件,能够检测原始网络数据中的shellcode网络安全威胁.
  • 使用Docker将解决方案容器化,使其易于在内部部署.
  • 在AWS上构建了公司的整个云基础设施.
  • 管理技术路线图,分配任务,指导初级开发人员.
  • 与法国最大的网络安全公司之一签订合同,开发特定的网络攻击检测软件.
  • 用自动备份和安全规则设置Neo4j和PostgreSQL数据库.
  • 使用AWS Lambdas设置隔离环境、防火墙安全规则和REST API.
  • 包括使用CloudFormation进行适当部署的几个AWS服务, such as AWS Lambda, SQS, SNS, Secrets Manager, S3, REST API, RDS, and AWS IoT.
  • 设计并实现公司的python代码库,并在之后管理其开发.
  • 在Rust中开发了RAM扫描器,以便将笔记本电脑的平均速度提高到5 Gbit/s.
技术:Python 3, Rust, Docker, Kanban, Team Management, IT项目管理, Cybersecurity, 云基础设施, Neo4j, REST, Python, REST APIs, AWS Lambda, 亚马逊网络服务(AWS), AWS CloudFormation, Architecture, Enterprise Systems, APIs, Amazon DynamoDB, Jupyter, Web Development, GraphQL, Cypher, Airtable, Amazon CloudFront CDN, Linux Servers, NGINX, Amazon S3 (AWS S3), SQL, Amazon EC2, SaaS, B2B, GitHub, API Integration, Web Servers, Cloud Deployment, Azure, 系统架构, Software, CTO, Venture Funding, Venture Capital, 软件开发, Retool, API Development, Data Engineering, Unit Testing, 抽象语法树(AST), Pytest, pylint, ANTLR, Code Review, Source Code Review, Software QA, Project Management

Data Scientist

2018 - 2019
Shift Technology
  • 实现了最先进的模型来检测和读取图片中的汽车牌照.
  • 研究并实施针对意大利特定类型欺诈性索赔的新检测算法.
  • 在意大利的销售会议期间为潜在客户提供技术解释和支持.
  • 创建要处理的管道, load, 每天从我们的客户那里分析几千兆字节的原始数据.
技术:c#,应用研究,异常检测,机器学习,Node.js, Enterprise Systems, Jupyter, Pandas, Web Scraping, Scraping, Video Streaming, SQL, Microsoft Excel, GitHub, Cloud Deployment, Software, 软件开发, Refinitive API, Data Engineering, Software QA

Teacher Assistant

2018 - 2018
华威大学
  • 学习CUDA并使用它开发模拟来演示对CPU的速度增益.
  • 教学生什么是GPU,什么是CUDA,什么时候应该考虑它.
  • 参与CUDA的开发.Julia CUDA包装器.
技术:GPU计算, 图形处理器(GPU), Numerical Analysis, NVIDIA CUDA, Jupyter, Video Streaming, GitHub, Software, 软件开发

首席后端开发人员

2015 - 2016
Frecibo
  • 设置由MySQL数据库和Ubuntu服务器组成的基础架构.
  • 建立持续开发和集成的CI/CD.
  • 设计并实现整个后端逻辑.
  • 创建了一个REST API与前端交互,并集成了端点.
Technologies: PHP, Marketplaces, cPanel, Payment APIs, SQL, Django, GitHub, Web Servers, Salesforce API, Office 365 API, Software, 软件开发

高性能Shellcode检测器的研究与开发

一个能够在原始网络数据中检测shellcode(一种网络安全威胁)的模型.

该项目由两大部分组成:研究高速推理模型及其实现. 由于保密协议,我不能透露研究方面的任何细节. Still, 我可以评论的主要问题是,模型应该具有较高的检测率和较低的误报率,以确保误报不会压倒分析师.

主要的项目限制之一是速度,因为它充当防火墙和, therefore, 必须实时决定让数据包通过还是不通过. 据估计,在一台普通笔记本电脑上,该解决方案至少需要达到1gbps的速度. Furthermore, 解决方案的安全性也很关键, 是什么让我使用结合了这两个特性的Rust语言. 必须在最低级别的缓存中处理和保存数据,并在CPU级别使用向量化以达到预期的速度.

最终的解决方案能够达到一台普通笔记本电脑的5GBps,检测率超过95%,假阳性率低于0.000000001%,也就是说每tb数据有一个误报.

Created MLJ.jl, Julia最大的机器学习框架

http://github.com/alan-turing-institute/MLJ.jl
作为我硕士学位的一部分, 我意识到Julia编程语言的生态系统有一个明显的缺点——缺乏统一的机器学习框架, 类似于Python中的scikit.

因此,我设计、构建并实现了该框架的第一个版本. 难点在于设计一个平衡的界面, 一些足够通用的东西,包括所有的模型,但又足够严格,不会太长,也不会太抽象.

在我硕士毕业之前, 十几个最基本的机器学习库已经统一起来, 这个项目引起了艾伦·图灵研究所的注意. 我被邀请在茱莉亚大会上展示它,并最终接管了它,并从那时起继续发展它.

Websek的创建者和所有者.co

Websek.co是一个简单的SaaS工具,用于提醒用户网站上潜在的安全问题和错误配置.

我用以下堆栈和结构开发了整个项目:
•前端使用AWS Lambda的REST API
•调度程序,在需要时使用AWS Lambda和AWS EC2启动EC2分析实例
•使用AWS Lambda验证实例是否正常的监视代理
•基于OWASP ZAP的分析工具
•PostgreSQL数据库
•一个简单的Bootstrap和jQuery前端

一篇同行评审的科学论文的合著者

我负责实现和研究用于铁磁体量子动力学数值分析的随机交换环模型.

该项目包括一个数值模型分析,以确定各种属性如何根据环境参数变化. 这种环境存在于三维空间和一维时间的四维晶格上,并且随着晶格的增加而变得越来越精确. 从早期的研究来看,误差范围是可以接受的,从大约100格开始.

Before this paper, 该模型的唯一实现将花费10分钟来模拟一个10格. 这是一个最小的晶格,不能精确地用于数值分析,而且速度太慢.

我用C语言重新设计并实现了模型, 创建一个软件,可以在几秒钟内模拟160格. 这样的表演, 我们可以对多个参数进行网格搜索, 为我们提供了每个参数如何影响结果的全局视图. 这篇论文收集了最重要的结果,并解释了其进一步的含义.

投资者:股票价格预测公司

http://github.com/dominusmi/Invester
一个用Julia写的股票价格预测机器人.

背景故事:我即将完成我的数学学位, 多年来我一直对股票交易感兴趣, 我决定试着给我的交易代理写信. 当时的想法不是做实时算法交易,而是主要做中长期建议.

Tech:我创建了一个框架,允许不同的交易策略,这样我就可以独立地比较不同的想法. 我还执行了回溯测试机制和各种策略, 一些人严重依赖机器学习,而另一些人则遵循更简单的信号. 代码被部署到云端,每天运行, 列出10个最值得购买的建议.

有趣的观察:算法越复杂, 它对COVID-19早期的处理就越差.

推特情绪分析

http://github.com/dominusmi/Twitter-Sentiment-Analysis-Project
基于Tweets的情感分析分类器.

Designed, researched, 并开发了几个分类器来处理和研究推文,并预测情绪是积极的, negative, or neutral.

火车票成本优化器

一个软件刮火车票供应商得到通知时,火车票是在一个有利的价格. 该软件将每天运行,并从多家火车票供应商那里收集数据,为特定路线找到最优惠的价格, 具有指定的约束条件, 例如时间段和台数的变化.

Languages

Python 3, Python, JavaScript, Cypher, Rust, HTML, CSS, SQL, Solidity, C#, Julia, C, Java, GraphQL, R, PHP, TypeScript

Libraries/APIs

API开发,Scikit-learn, jQuery, Pandas, refintive API, PyTorch, REST API, Node.. js、SQLAlchemy、Salesforce API、Office 365 API、React、Google API

Tools

AWS CloudFormation, Jupyter, GitHub, Pytest, Retool, pylint, PyCharm, Microsoft Excel, Amazon CloudFront CDN, NGINX, Wix, Webpack, ANTLR

Paradigms

数据科学、单元测试、B2B、异常检测、看板、REST

Platforms

AWS Lambda, 亚马逊网络服务(AWS), Docker, Amazon EC2, Azure, Linux, NVIDIA CUDA, cPanel, 谷歌云平台(GCP), Blockchain, Databricks

Storage

Neo4j,云部署,PostgreSQL, Amazon DynamoDB, Amazon S3 (AWS S3),图数据库

Other

APIs, API Integration, Software, 软件开发, Data Engineering, Machine Learning, Graph Theory, Algebra, Architecture, Web Scraping, Scraping, Linux Servers, Data Scraping, SaaS, Web Servers, OpenAI GPT-3 API, 系统架构, 抽象语法树(AST), Code Review, Source Code Review, Software QA, 人工智能(AI), Statistics, Applied Research, Physics, Mathematics, 应用数学, Game Theory, 强化学习, Bayesian Inference & Modeling, 科学计算, Team Management, IT项目管理, 云基础设施, Product Strategy, 竞争战略, Product Management, Roadmaps, 软件架构, eBPF, Optimization, Enterprise Systems, GPU Computing, 图形处理器(GPU), Numerical Analysis, Bots, Web Development, Trading, Stock Trading, 自然语言处理(NLP), Airtable, Apollo Server, Video Streaming, Marketplaces, Payment APIs, Data Analysis, GPT, 生成预训练变压器(GPT), CTO, Venture Funding, Venture Capital, FastAPI, Full-stack, ChatGPT, Bitcoin, AWS CloudFront, Paddle, Data Visualization, 大型语言模型(llm)

行业专业知识

网络安全、项目管理

Frameworks

Django, Bootstrap

2017 - 2018

信息学与应用数学硕士学位

华威大学-华威,英国

2014 - 2017

数学或物理学士学位

华威大学-华威,英国

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring