GLM-4.7-Flash、性能それほどでもなく、いまのところ量子化がうまくいってない

nowokay https://blog.hatena.ne.jp/nowokay/ きしだのHatena https://nowokay.hatenablog.com/ GLM-4.7はコーディング能力の高さが認められるようになってきています。その軽量版、30B-A3BのGLM-4.7-Flashが出ていました。 https://huggingface.co/zai-org/GLM-4.7-Flash DeepSeekのMultihead Latent Attentionを使っているのが売りっぽい。ただ、まだ使える環境がない・・・ OpenRouterがクソ遅い・・・今のところZ.aiのAPIで使えなかったので、OpenRouterを使ったのだけど、遅い。とぎれとぎれに出てきて結果12tok/secというところ。でも、答えが返ってこないことがある。コ… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fnowokay.hatenablog.com%2Fentry%2F2026%2F01%2F20%2F114010" title="GLM-4.7-Flash、性能それほどでもなく、いまのところ量子化がうまくいってない - きしだのHatena" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/n/nowokay/20260120/20260120101812.png Hatena Blog https://hatena.blog 2026-01-20 11:40:10 GLM-4.7-Flash、性能それほどでもなく、いまのところ量子化がうまくいってない rich https://nowokay.hatenablog.com/entry/2026/01/20/114010 1.0 100%