Deepseek v4 的开源设计(sglang#23639)把这一步走得更彻底——直接把完整 token 序列当作 cache 身份本身。 unifiedradixtree 的节点 identity 不再用 hash 表示,而是 这段 cache. Subreddit for the deepseek coder language model However it appears not to run on my gpu according to resource monitor and at like 2.