您尚未登录,请登录后浏览更多内容! 登录 | 加入最MC

QQ登录

只需一步,快速开始

 找回密码
 加入最MC

QQ登录

只需一步,快速开始

查看: 140|回复: 0
打印 上一主题 下一主题

[【少女の茶会】] 叙述聚焦数据架构前沿技术,手大数据平台架构技术交流会成功举办

[复制链接]
跳转到指定楼层
楼主
发表于 2021-12-10 06:25:27 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

近日,手数据平台部联合“手中学”,专题举办“手大数据平台架构技术交流会”(KDPAC),吸引了各行业数据相关开发者的参与。除了国内,快手刷粉丝在国际领域也崭露头角逐渐的受到更多外国友人的青睐。

从到,再到,从到,再到,从离线数仓到时数仓架构,再到数据湖架构,近10多年中,大数据平台架构经历了速演变。各大互联或借助开源生态,或通过自研构建大数据架构系统,促进数据相关业务的价值挖掘与发展,为的战略发展、产品改进、用户增长带来收益。
作为全球领先的生活分享社区,目前手日活跃用户超过亿,库存短视频数量超过200亿条,直播日活超过17亿,电商日活超过1亿。在海量的UGC数据、业务数据、用户数据背后,支撑手数据业务的大数据平台架构系统,经历了几个阶段的高速发展。为此,交流会着重介绍了手在大数据存储、调度、计算上的技术挑战、应用、演进与最佳践。
(▲交流现场)
本次交流采取线下线上结合的参会方式。交流会开放了部分线下参会额,所有现场观众需佩戴口罩,确保测温和健康宝状态正常,在签署健康声明后方可入场,入会就座时也均保持了一定间隔。此外,交流全程还通过“手APP”直播,观看总人数超15万人。
交流过程中,该场出品人之一、手平台研发数据平台负责人韦彬首先致辞。他介绍,手大数据平台的使命是以领先的大数据技术,激活数据价值,赋能业务,打造手核心竞争力。大数据团队从2021年创立之初没有全职数据同学,到目前团队已逐渐完备。在手做大数据有四个特点,一是数据规模大,对数据治理的要求很高;二是数据驱动的文化深入人心,团队一直致力于对标行业最好水平打造数据中台;是极度重视效率,确保数据平台灵活可用;四是为满足手线上社区的场景,对数据的建模能力、应用能力都有极高要求。
(▲手平台研发数据平台负责人韦彬)
第二位出品人、手大数据架构团队负责人赵健博介绍,手大数据架构团队的领域主要涉及六个方向,分别是:存储系统、消息队列、资源调度、时引擎、离线引擎、OLAP引擎。近几年,手大数据架构的技术发展迅猛,从离线计算分析到时计算,从大集群到超大集群,飞速迭代优化。
(▲手大数据架构团队负责人赵健博)
随后,来自手的分布式存储高级研发工程师徐增强、离线计算引擎方向负责人王磊、分布式消息队列高级研发工程师陈春斌,以及讯数据平台部数据湖研发负责人邵赛赛,分别带来主题演讲。
徐增强从数据规模、挑战和践等几个方面,对手分布式HDFS系统进行了全方位解读,并详细介绍了手EB级HDFS集群发展历程中遇见一些核心问题的解决思路,如主节点扩展性问题、主节点处理能力瓶颈问题、节点热点问题、重要任务的分级保障问题等。
王磊介绍了手H元数据在亿级分区规模的存储使用上所面临的总量多、增速、压力大等多方面挑战,针对上述挑战给出了手所采取的系列优化措施,包括读写分离、API性能优化、流量分级控制、F水平扩容等,从而达到提升H元数据服务稳定性和性能的目标。
陈春斌介绍了手K在业务速增长过程中遇到的集群扩容瓶颈、集群间资源利用率不均、业务接入效率低等问题,针对上述问题从集群水平扩展性和水平扩展性等方面对K进行针对性改造,从而达到平滑支撑业务速增长和提高资源利用率的目的。
邵赛赛从数据湖技术需要具备的能力,如何构建一个统一的数据湖存储、并在其上进行多种形式的数据分析角度切入,介绍了I的设计初衷、优点及能力,使听众对表格式这一领域有了充分理解,并深入了解I的设计、现、优势以及使用方式。
(▲演讲嘉宾合影:从左至右,分别为徐增强、陈春斌、邵赛赛、赵健博、王磊、李远策)
手以技术为核心竞争力,十分重视技术创新和应用,同时也希望通过更多更广泛的技术交流,和业内开发者分享经验,碰撞出更多智慧火花,推动技术不断前进。“手中学”作为内部专业人才培养平台,旨在通过提供丰富多样的专业课堂培训、比赛、技术交流,助力人才成长,提升专业能力和专业影响力。
今年7—8月,“手中学”曾联合手大前端团队举办“手大前端技术交流会2021”,受疫情影响仅做线上直播,而随着疫情防控的逐步稳定,为了给观众带来更好的交流互动体验,本次技术交流首次开放了部分线下参会额。未来,由“手中学”举办的技术交流还将以每季度一次的频次长期开展。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友