西西有點東西

我只是想找個地方記錄

ollama模型使用記錄

使用者因為在架站上玩得太上癮,導致記憶體不足。購買了DDR4 16G記憶體,並測試不同模型的效能。根據伺服器20GB記憶體,估算出可同時處理使用者的表格。最終選擇了cwchang/llama-3-taiwan-8b-instruct:latest模型,但發現速度過慢。經測試後發現是Blinko用到之前的模型,統一模型後記憶體降至18G~20G,符合使用者的硬體規格。