Andrei Apostol, Iași,罗马尼亚的开发者
Andrei is available for hire
Hire Andrei

Andrei Apostol

验证专家  in Engineering

人工智能开发人员

Location
Iași, Romania
至今成员总数
2022年9月1日

安德烈在他的家乡罗马尼亚学习计算机科学,并在阿姆斯特丹大学完成了他的人工智能硕士学位. 经过多年的训练,他积累了人工智能方面的实践经验, 开发数据处理管道, and deployment. 他是一名工程师,总是期待新的挑战. Andrei也有学术经验,发表了两篇关于神经修剪和量化的论文, 哪些受到了学术界的好评.

Portfolio

Omnimodular
生成预训练变压器(GPT)...
Braincreators
Python 3, NVIDIA Triton, FastAPI, Streamlit,计算机视觉,对象检测...
Mantis NLP
聊天语言,BERT,自然语言处理(NLP),机器学习...

Experience

Availability

Part-time

首选的环境

Linux, Visual Studio Code (VS Code), Slack, Rocket.聊天,谷歌云/套件

最神奇的...

...我在benelearning 2020上发表的硕士论文获得了最佳论文奖,这篇论文是关于我开发的一种新颖的修剪算法.

工作经验

机器学习工程师

2021 - PRESENT
Omnimodular
  • 为多类文档分类构建了一个定制的、灵活的类似bert的体系结构,并对来自不同客户端的数据进行了训练, 获得90-94%的平均准确率.
  • 将传统的NLP增强模型与GPT-3大语言模型相结合,为客户进行数据增强, 将错误率降低50%.
  • 使用基于Apache Arrow的hug Face数据集来处理通常不适合内存的大量数据,并通过批处理和多处理实现了高效且可复制的数据处理管道.
  • 定期召开客户会议, 给出我们技术解决方案的高层次概述,并解释我们的核心指标.
Technologies: 生成预训练变压器(GPT), 自然语言处理(NLP), Hugging Face, Transformers, BERT, DVC, Docker, Docker Compose, FastAPI, 机器学习操作(MLOps), 语言模型, Python, 软件工程, 机器学习, 人工智能(AI), 大型语言模型(llm), 概念验证(POC), 最小可行产品(MVP), 自然语言理解(NLU), Pandas, Matplotlib, Contract, GitHub, 信息提取, 开放神经网络交换(ONNX), 生成式人工智能(GenAI), PDF, ChatGPT, OpenAI GPT-3 API, OpenAI API, 数据可视化

机器学习工程师

2020 - PRESENT
Braincreators
  • 训练YOLOv5目标检测网络,用于废物管理和回收, 在传统GPU上,以每秒200帧以上的速度,在40多个类别的对象上获得了超过95%的平均精度分数.
  • 围绕对象检测网络构建一个应用程序,使用FastAPI公开端点,并为UI使用Streamlit, 训练后将网络转换为ONNX格式,以加快推理时间.
  • 使用CLIP预训练模型创建了一个用于分布外检测的模块, 在分布内/分布外分类中获得超过97%的准确率,同时允许在不重新训练的情况下更改类分类法.
  • 与项目干系人定期举行会议, 为客户提供演示和演示,为下一个里程碑提供估计, 并进行冲刺计划会议, 跟踪进度.
  • 在《欧博体育app下载》特刊发表论文《欧博体育app下载》, 证明修剪和量化可以在不牺牲精度的情况下带来更大的加速.
  • 使用带有重新识别的SORT算法实现对象跟踪,跟踪对象随时间的轨迹. 获得85%以上的MOTA(多目标跟踪精度)和80%以上的IDF1.
技术:Python 3, NVIDIA Triton, FastAPI, Streamlit,计算机视觉,对象检测, PyTorch, Docker, Docker Compose, Deep Learning, 你只看一次(YOLO), 神经网络修剪, Quantization, 检测工程, 开放神经网络交换(ONNX), Agile, Bash, Python, 软件工程, 机器学习, 人工智能(AI), 概念验证(POC), 最小可行产品(MVP), Pandas, Matplotlib, Contract, PyTorch闪电, GitHub, OpenCV, 英伟达TensorRT, 图像处理, Hugging Face, 生成式人工智能(GenAI), 数据可视化

机器学习工程师

2023 - 2023
Mantis NLP
  • 设计了一种基于bert的医学研究文献标注体系结构. 实施有效和可扩展的培训管道, 能够在几个小时内处理1500多万份文件. 达到了最先进的微f1分数的70%.
  • 创建了一个易于创建的面向用户的应用程序, deployment, 以及使用AWS Sagemaker在生产环境中删除机器学习模型. 包括监视、警报和完整的测试套件,以确保质量和可靠性.
  • 使用Langchain与ChatGPT和FAISS. 创建了一个个人助理,可以根据用户收集的笔记回答用户的问题. 执行快速工程以获得更高质量的响应.
  • 与主要客户和利益相关者保持密切联系,以确保我们的需求一致,并在项目的各个阶段创造最高质量的可交付成果.
Technologies: 聊天语言,BERT,自然语言处理(NLP),机器学习, OpenAI GPT-3 API, OpenAI GPT-4 API, LangChain, Chatbots, AWS IoT, 亚马逊SageMaker, FAISS, 生成预训练变压器(GPT), 生成预训练变压器3 (GPT-3), 提示工程, 亚马逊网络服务(AWS), OpenAI API, 数据可视化

机器学习研究实习

2019 - 2020
BrainCreators
  • 研究并积累了神经网络修剪技术的专业知识,这是我硕士论文的一部分.
  • 开发了一种新的剪枝算法,可以获得高稀疏度场景和其他属性(如训练期间的剪枝能力)的最新结果, 计算温顺, 以及超参数不变性.
  • 因围绕上述算法撰写科学论文并在比利时举行的BeneLearn 2020会议上发表而获得最佳论文奖, Netherlands, and Luxembourg.
技术:PyTorch, TensorBoard, Python 3, 科学计算, Research, 计算机视觉, 深度神经网络, 神经网络修剪, Quantization, Docker, Docker Compose, Python, 软件工程, 机器学习, 人工智能(AI), Pandas, Matplotlib, GitHub, OpenCV, 图像处理, 数据可视化, TensorFlow

Data Scientist

2019 - 2019
FeedbackFruits
  • 利用SARIMA方法建立了时间序列预测模型, 在置信范围内实现所有预测的低均方误差.
  • 创建了一个编码器/解码器门控循环单元网络用于文档部分分类, 获得超过90%的准确度.
  • 通过RESTful api公开核心功能,将训练好的模型部署到生产环境中,并监控生产环境中的性能.
技术:瓶, 长短期记忆(LSTM), Time Series, ARIMA Models, REST, APIs, Data Science, Python, 软件工程, 机器学习, 人工智能(AI), 自然语言理解(NLU), Pandas, Matplotlib, GitHub, 信息提取

研究科学家实习生

2017 - 2017
Amazon.com
  • 分析客户在平台上的行为,并开发了一个具有较高ROC-AUC得分的随机森林模型.
  • 使用Apache Spark处理大量数据,并使用Python和Scala api以及Spark SQL创建数据处理管道来过滤和准备数据.
  • 进行A/B测试,并将结果模型集成到几个Amazon站点中.
技术:Python 3, Apache Spark, Zeppelin, Random Forests, 机器学习, Spark SQL, Scikit-learn, Python, 软件工程, 人工智能(AI), GitHub, 亚马逊网络服务(AWS)

FlipOut |通过符号翻转发现冗余权重

http://github.com/AndreiXYZ/flipout
一种神经网络剪枝方法, 哪一种方法在准确性和稀疏性的权衡方面获得了最先进的结果. 它的工作原理是在训练过程中监控权重,并去除在0值附近振荡的权重, 假设振荡代表了这些权值的局部最优.

它可以去除普通网络中98%以上的连接,而对准确性几乎没有影响, 允许大的速度增益. 与文献中的基线相比, 这种方法可以在训练时进行修剪, 对超参数的选择不敏感, 并且允许直接选择稀疏度级别.

我围绕这种方法写了一篇论文,并发表在BeneLearn 2020上, 获得最佳论文奖.

Languages

Python 3, Python, Bash, SQL

Frameworks

Flask, Streamlit, Apache Spark

Libraries/APIs

PyTorch, Matplotlib, OpenCV, Scikit-learn, Pandas, PyTorch闪电, TensorFlow, NumPy

Tools

TensorBoard, 你只看一次(YOLO), Slack, GitHub, ChatGPT, Git, Docker Compose, Spark SQL, 亚马逊SageMaker

Platforms

Visual Studio Code (VS Code), Rocket.聊天、Linux、Docker、齐柏林飞艇、AWS IoT、亚马逊网络服务(AWS)

Other

机器学习, Deep Learning, 自然语言处理(NLP), 计算机视觉, 长短期记忆(LSTM), 深度神经网络, 神经网络修剪, Quantization, FastAPI, 对象检测, Transformers, BERT, Classification, English, 谷歌云/套件, 人工智能(AI), 概念验证(POC), 最小可行产品(MVP), 自然语言理解(NLU), Contract, 信息提取, 生成预训练变压器(GPT), OpenAI GPT-3 API, 数据可视化, Statistics, 软件工程, 科学数据分析, Random Forests, APIs, 科学计算, Research, NVIDIA Triton, 检测工程, 开放神经网络交换(ONNX), Hugging Face, DVC, 机器学习操作(MLOps), 语言模型, Algorithms, Data Analytics, 大型语言模型(llm), 英伟达TensorRT, 图像处理, 生成对抗网络(GANs), 生成式人工智能(GenAI), OCR, PDF, Chatbots, OpenAI API, 信息检索, 集群计算, Time Series, ARIMA Models, DeepSpeed, 3D, OpenAI GPT-4 API, LangChain, FAISS, 生成预训练变压器3 (GPT-3), 提示工程

Paradigms

面向对象编程(OOP),数据科学,敏捷,REST

2018 - 2020

人工智能硕士学位

阿姆斯特丹大学-阿姆斯特丹,荷兰

2015 - 2018

计算机科学学士学位

亚历山德鲁伊安库萨大学- Iași,罗马尼亚

2023年1月至今

模型并行:构建和部署大型神经网络

NVIDIA

2018年5月至今

雅思学术证书(母语水平)

British Council

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

分享你的需求

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

选择你的才能

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring