add vacab parallel embedding #315

mwiacx · 2024-09-04T12:04:31Z

add vacab parallel embedding

blankde · 2024-09-05T06:27:33Z

LGTM

sunpengsdu · 2024-09-06T22:55:48Z

internlm/model/modules/embedding.py

+            assert (
+                num_embeddings % gpc.weight_parallel_size == 0
+            ), f"{num_embeddings} is not divisible by {gpc.weight_parallel_size}"
+            self.num_embeddings_per_partition = num_embeddings // gpc.weight_parallel_size


这里默认了ISP模式下就采用了vocab_parallel。是不是可以用vocab_parallel作为一个统一的控制，它只和是否用embedding和head共享权重相关，如果用户在Modeling文件里，需要共享权重，则手动设定vocab_parallel为true即可。其他情况下，默认走之前的切分emb的逻辑。避免之前的代码出现BC，特别是有一些llama模型加载HF权重的设计，都是走的切分emb维度

比如CI的那个错误

sunpengsdu · 2024-09-06T23:02:08Z

internlm/model/modules/embedding.py

+    def forward(self, input_: Tensor) -> Tensor:
+        if self.vocab_parallel:
+            # Build the mask.
+            input_mask = (input_ < self.vocab_start_index) | (input_ >= self.vocab_end_index)


前面is_using_isp切分的是self.num_embeddings_per_partition = num_embeddings // gpc.weight_parallel_size，但是并没有构建vocab_start_index等

isp是聚合参数，所以不能走vocab_parallel的代码，需要走原来的逻辑

sunpengsdu · 2024-09-06T23:04:56Z

internlm/core/parallel/comm/isp.py

@@ -145,7 +145,7 @@ class EmbeddingWeightParallelCommunicator:

    def __init__(self, parallel_mode: ParallelMode) -> None:
        self.parallel_mode = parallel_mode
-        self.emb_column = 1
+        self.vocab_dim = 0


这里麻烦的一点是要是ISP模型保持原来默认切分维度，又有了vocab切的可选项，要怎么办

可能是register_module_hook的时候，判断一下

add vacab parallel embedding

57c7990

mm-assistant bot assigned sunpengsdu Sep 4, 2024

fix lint

93767df

sunpengsdu reviewed Sep 6, 2024

View reviewed changes

restore isp embedding default split dim

35c53cd

mwiacx force-pushed the feat/add-vocab-parallel-embedding branch from 0b67f09 to 35c53cd Compare September 7, 2024 04:22

sunpengsdu approved these changes Sep 10, 2024

View reviewed changes

sunpengsdu merged commit 95dcc04 into InternLM:develop Sep 10, 2024
19 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

add vacab parallel embedding #315

add vacab parallel embedding #315

mwiacx commented Sep 4, 2024

blankde commented Sep 5, 2024

sunpengsdu Sep 6, 2024

sunpengsdu Sep 6, 2024

mwiacx Sep 7, 2024

sunpengsdu Sep 6, 2024

mwiacx Sep 7, 2024

sunpengsdu Sep 6, 2024

sunpengsdu Sep 6, 2024

mwiacx Sep 7, 2024

add vacab parallel embedding #315

add vacab parallel embedding #315

Conversation

mwiacx commented Sep 4, 2024

blankde commented Sep 5, 2024

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment