メインコンテンツへスキップ

圧縮

マジ!?LLMをロスレス圧縮してGPU推論が爆速に!動的長浮動小数点フォーマット DFloat11 が効率化の鍵
·2 分
2025/04 LLM 圧縮 GPU 推論 最適化