ColossalAI

mirror of https://github.com/hpcaitech/ColossalAI.git synced 2026-07-12 19:06:17 +00:00

Files

pre-commit-ci[bot] 08a1244ef1 [pre-commit.ci] auto fixes from pre-commit.com hooks

for more information, see https://pre-commit.ci

2025-08-06 06:16:38 +00:00

chatglm2_6b

[pre-commit.ci] pre-commit autoupdate (#5572 )

2024-07-01 17:16:41 +08:00

__init__.py

[shardformer] added development protocol for standardization (#4149 )

2023-07-04 16:05:01 +08:00

bert.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

blip2.py

[shardformer] support bias_gelu_jit_fused for models (#5647 )

2024-04-29 15:33:51 +08:00

bloom.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

chatglm2.py

[Device]Support npu (#6159 )

2024-12-17 15:42:39 +08:00

command.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

deepseek_v3.py

[shardformer] support pipeline for deepseek v3 and optimize lora save (#6188 )

2025-02-14 14:48:54 +08:00

deepseek.py

[moe] add parallel strategy for shared_expert && fix test for deepseek (#6063 )

2024-09-18 10:09:01 +08:00

falcon.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

gpt2.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

gptj.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

jit.py

[misc] update pre-commit and run all files (#4752 )

2023-09-19 14:20:26 +08:00

llama.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

mistral.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

mixtral.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

opt.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

qwen2.py

[Distributed RLHF] Integration of PP (#6257 )

2025-08-05 13:59:02 +08:00

qwen3.py

[pre-commit.ci] auto fixes from pre-commit.com hooks

2025-08-06 06:16:38 +00:00

sam.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

t5.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

vit.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00

whisper.py

[upgrade]Upgrade transformers (#6320 )

2025-05-27 14:29:01 +08:00