大数据工程师求职简历模板.docx
《大数据工程师求职简历模板.docx》由会员分享,可在线阅读,更多相关《大数据工程师求职简历模板.docx(4页珍藏版)》请在第一文库网上搜索。
1、XXX简历-大数据工程师姓名:XXXO工作经验:X年I电话:性别:X0毕业学校:xG邮箱:xxxxxx画年龄:XXg学历:XXQ现居:XX求职意向目标职能:大数据开发工程师目前状态:离职随时到岗目标地点:北京目标薪资:面议Q工作经历xxx.08-xxxx.02xxxx时代科技有限公司大数据工程师个人技能1 .熟练掌握HadOOP底层架构、HDFS存储机制和读写流程、MaPRedUCe框架原理和工作机制、Yarn组成架构和调度机制、MR调优以及高可用的部署。2 .熟练掌握Hive数仓搭建,能够熟练使用HQ1进行企业级开发,掌握HQ1中的相关函数和HQ1语句执行流程,以及Hive的压缩格式和存储格
2、式的选择,Hive杳询的相关优化措施。3 .熟练掌握HBase底层数据存储原理与读写流程,能够熟练使用HBase进行分布式的、非结构化的存储,能够通过预分区和RowKey设计处理HBase的数据倾斜问题,能够配置HBase的高可用和对其内存进行优化。4 .熟练掌握F1ume内部的结构和原理,以及事务机制,能够使用F1ume进行分布式的海量日志采集,聚合和传输。能够自定义拦截器链对传输数据进行过滤与分类,以及使用Gang1ia对其进行监控。5 .熟练掌握Kafka内部架构和写入流程,能够编写Kafka的生产者和消费者的高级API与彳氐级API、Kafka拦截器、KafkaStream进行数据清洗
3、。6 .熟练掌握SPark的工作原理,能够熟练使用SParkCore、SparkSQ1xSParkStreaming进行编程,能够对Spark进行调优,了解Spark内核。7 .熟练掌握ZOokeePer工作原理,了解FIink基本架构、流式处理原理、核心计算框架。8 .熟练使用MySQ1xRedis数据库,能够使用MongoDBsEIasticSerach数据库。9 .熟练使用Sqoop对MySQ1的数据进行导入与导出,Azkaban和Oozie进行任务调度,GitHub管理项目。10 .熟练使用Java、SCa1a进行编程,熟悉使用1inUX操作系统,能够使用SheII、Python编写脚
4、本。项目经历项目名称:XX时代数仓项目软件架构:F1ume+Kafka+Hadoop+Zookeeper+HiveSpark+MySQ1+Azkaban+Sqoop开发工具:IDEA+JDK1.8+Sca1a+Maven+Git项目描述:对果敢时代的用户行为数据和业务交互数据进行采集、清洗、管理、维护、并进行统计、分析、挖掘,提炼出有价值的信息,基于事实的管理来推动决策过程与实现价值增长。1【数据采集】采用F1ume+Kafka+F1ume架构,通过前端埋点,Nginx负载均衡,Tomcat的Iog4j写日志,F1ume采集、清洗、分类日志,Kafka缓存,F1ume消费Kafka数据,采集行
5、为日志到HDFS中。2 .【数仓搭建】数据仓库采用ODS+DWD+DWS+ADS四层分层搭建。将MySQ1中的业务交互数据通过Sq。P导入到ODS层。进而将ODS层中的业务交互数据与用户行为数据通过SParkSQ1进行清洗、更改存储方式、更改压缩方式、进行维度建模后转存到数据仓库DWD层。计算数据仓库DWD层的复用度,将复用度高的数据进行轻聚合后转存到数据仓库DWS层。ADS层中以DWD层或者DWS层的数据为基础,通过具体需求聚合数据,组成各种统计报表,统计结果最终同步到MySQ1数据库供B1等查询使用。3 .【数据分析】流程分析:登录、浏览、下单&支付、交易成功、售后等。用户分析:用户价值分
6、析、用户粘性分析、满意度分析等。商品分析:点击量、转化率、加购率、收藏率、购买人数、销量、销售额、热门品类排行榜、动销率、次品率、投诉率、售罄率、库存量等。责任描述:1 .参与了项目需求的讨论与分析、HiVe表的设计、架构的搭建。2 .负责了用户分析部分的需求实现:活跃用户统计、新增用户统计、用户转化率分析、用户留存率分析、用户流失率分析等。3 .负责了部分流程分析与部分商品分析的需求实现:收藏率、加购率、GMV分析、热门品类排行榜、热门商品ToPI0、动销率等。4 .通过Sqoop将数据同步到MySQ1中,编写执行脚本,并通过Azkaban进行调度执行。技术要点:1 .将MySQ1中的业务交
7、互数据通过Sqoop导入到Hive中,并编写定时导入脚本。2 .搭建四层数据仓库,为原始数据层ODS、明细数据层DWD、服务数据层DWS、应用数据层ADS。3 .存储在ODS层的原始数据表采用行式存储,采用Gzip压缩。将ODS层的原始数据通过SparkSQ1进行清洗、改为Parquet列式存储、改为Snappy压缩格式后转存到数据仓库DWD层。4 .对数据进行维度建模,采用维度较少的星型模型,减少Join,即减少Shuff1e,有效的提高性能。5 .分析DWD层数据的复用性,将复用度高的数据进行轻聚合后转存到数据仓库DWS层。6 .ADS层中以DWD层或DWS层的数据为基础,通过具体的业务需
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 工程师 求职 简历模板
