デジタルコマースの成長を加速する革新的AIサービス


一人ひとりに最適化された体験を創出するパーソナライズAI
AIで高付加価値顧客を効率的かつ確実に獲得
生成AIがもたらす圧倒的なクリエイティブ革新
ByteArk独自開発の超高性能LLM推論フレームワークは、DeepSeekモデル群に最適化。PD分離、EPLB(優先度スケジューリング)、DeepEP(並列実行)、DeepGEEM(メモリ最適化)など最先端技術を統合し、マルチGPU・マルチノード環境で50%超のスループット向上とレイテンシ半減を実現。グローバル規模のリアルタイムAI導入を可能にし、ミッションクリティカルな産業用途にも対応します。


















ByteArkはAIインフラとエンタープライズソリューションのグローバルリーダーです。本社は杭州未来科技城。LLM推論最適化、業界特化AIアプリケーション、高性能GPUコンピューティングに注力し、基盤計算とビジネスイノベーションを融合した次世代AIプラットフォームを構築しています。
世界トップクラスのエンジニアが70%以上を占める技術主導組織。ByteArkはグローバル企業に信頼性・拡張性・最先端のAIコンピュートを提供。国家ハイテク企業・浙江省イノベーションリーダーとして100件超の特許・著作権を保有し、AIインフラの未来を切り拓いています。
10倍の価値創造、控えめなリターン、社会への還元
Create tenfold value, take modest returns, give back to society
すべての意思決定は客観的事実・深い分析・合理的思考に基づきます。真の価値は知恵と事実から生まれます。
生涯学習と全体観を重視し、ビジネス・顧客・市場を深く理解してイノベーションと変化適応を推進します。
深く傾聴し、明快に伝え、ニーズとソリューションをつなぎます。効果的なコミュニケーションは価値創造の架け橋です。
卓越を追求し、高い目標を掲げ、常に基準を引き上げます。最高を目指すことで指数的な価値を実現します。
誠実・正直を貫き、間違いを認めて改善する勇気を持ちます。誠実さは持続的価値の礎であり、社会への約束です。
















「起業は航海のようなもの。遠い目的地を目指しつつ、途中で新たな島を発見し資源を得る必要がある」——CEO Davidは半導体業界でITエンジニアとしてスマートフォンプロジェクトを率いた後、2018年にByteArkを創業した連続起業家です。

1980年代生まれのビジョナリー起業家。複数のグローバルビジネスを創業し、年商2,000万ドル超。2014年からブロックチェーン分野の先駆者として活躍し、トレーディング・資本運用に精通。2018年にByteArkを創業し、4,000万ドル超の売上と1億ドル超のデジタル資産を管理。









专注于 推理执行阶段 本身的效率与执行路径优化,包括 Prefill/Decode 阶段的解耦、缓存调度、采样优化等。
1. 负责 LLM 推理系统的执行路径、资源调度与通信模块的系统级优化; 2. 设计并实现支持大规模多卡部署的调度执行架构,提升系统吞吐能力; 3. 优化通信链路与数据传输,减少跨节点通信延迟与带宽瓶颈; 4. 推进混合精度策略(如 FP16、BF16、INT8)在推理框架中的高效应用; 5. 支持并推动开源或自研推理框架(如 vLLM、SGLang)在系统层的深度性能演进。 职位要求: 1. 本科及以上学历,计算机科学、人工智能、软件工程或相关专业; 2. 熟悉主流推理框架,具备 vLLM、SGLang、TensorRT-LLM 等推理框架的优化经验者优先; 3. 熟悉通信优化,具备 NCCL、NVSHMEM、RDMA 等通信库的使用经验,了解通信开销的优化方法; 4. 理解资源管理机制,熟悉任务调度、并发控制、NUMA 架构、CPU/GPU 亲和性优化等系统层优化手段; 5. 具备系统级性能瓶颈分析能力,能够跨模块主导复杂性能问题的定位与解决,推动整体性能优化闭环。
关注推理框架本身的底层基础设施与系统结构,如资源分配、跨节点通信、GPU 编排、混合精度计算等。
1. 负责 LLM 推理系统的执行路径、资源调度与通信模块的系统级优化; 2. 设计并实现支持大规模多卡部署的调度执行架构,提升系统吞吐能力; 3. 优化通信链路与数据传输,减少跨节点通信延迟与带宽瓶颈; 4. 推进混合精度策略(如 FP16、BF16、INT8)在推理框架中的高效应用; 5. 支持并推动开源或自研推理框架(如 vLLM、SGLang)在系统层的深度性能演进。 职位要求: 1. 本科及以上学历,计算机科学、人工智能、软件工程或相关专业; 2. 熟悉主流推理框架,具备 vLLM、SGLang、TensorRT-LLM 等推理框架的优化经验者优先; 3. 熟悉通信优化,具备 NCCL、NVSHMEM、RDMA 等通信库的使用经验,了解通信开销的优化方法; 4. 理解资源管理机制,熟悉任务调度、并发控制、NUMA 架构、CPU/GPU 亲和性优化等系统层优化手段; 5. 具备系统级性能瓶颈分析能力,能够跨模块主导复杂性能问题的定位与解决,推动整体性能优化闭环。
