2024 大模型秋招面试高频问题与解答总结

2024 大模型秋招面试高频问题与解答总结 | 极客日志

# 我们从下面的 ir 的 a、b、c 三个点去获得 extract 的值，都是相同的，都是源自于 %1 = tensor.empty 创建时获得的随机值。
%1 = tensor.empty
%extract = tensor.extract %1 // a 点
%fill = linalg.fill outs(%1)
%extract = tensor.extract %1 // b 点
%map = linalg.map outs(%1)
%extract = tensor.extract %1 // c 点

// 若把 %load clone 到 它的 user 前（scf.forall）内，这样程序的语意就被改变了，因为中间有对 %alloc 的 def
%load = memref.load %alloc
def %alloc
scf.forall
  use %load

def topological_sort(graph):
    # graph: dict {node: [neighbors]}, neighbors are consumers of node
    in_degree = {node: 0 for node in graph}
    for u in graph:
        for v in graph[u]:
            in_degree[v] += 1
    
    queue = [node for node in graph if in_degree[node] == 0]
    result = []
    
    while queue:
        node = queue.pop(0)
        result.append(node)
        for neighbor in graph[node]:
            in_degree[neighbor] -= 1
            if in_degree[neighbor] == 0:
                queue.append(neighbor)
    
    return result if len(result) == len(graph) else []

2024 大模型秋招面试高频问题与解答总结

Triton (OpenAI 版)

1. 你是怎么做 triton kernel 优化的

2. triton 的下降流程，讲讲你对 triton 中 layout 的理解

3. 支持 triton 的好处，和官网的 triton 有何不同

MLIR

1. mlir codegen 这条路更适合处理哪类任务？

1. 对 SIMD 硬件的优化和 SIMT 硬件的优化(or codegen) 有什么异同

3. 算子融合先 tile 再 fuse 还是先 fuse 再 tile

4. mlir codegen 这条路针对推理和训练有什么不同么

5. 软流水展开的循环一般是哪一级

6. mlir 中 tensor 和 memref 抽象设计理念和异同

7. linalg dialect 的设计理念

8. mlir 中一些概念

9. 写一个图的拓扑排序

LLM

1. 请简单讲讲你了解的推理中常见的优化技术

2. attention 相关问题

Arch

1. 讲讲 gpu 的 SM

C++

Coding

总结

更多推荐文章

相关免费在线工具

2024 大模型秋招面试高频问题与解答总结

Triton (OpenAI 版)

1. 你是怎么做 triton kernel 优化的

2. triton 的下降流程，讲讲你对 triton 中 layout 的理解

3. 支持 triton 的好处，和官网的 triton 有何不同

MLIR

1. mlir codegen 这条路更适合处理哪类任务？

1. 对 SIMD 硬件的优化 和 SIMT 硬件的优化(or codegen) 有什么异同

3. 算子融合先 tile 再 fuse 还是先 fuse 再 tile

4. mlir codegen 这条路针对推理和训练有什么不同么

5. 软流水展开的循环一般是哪一级

6. mlir 中 tensor 和 memref 抽象设计理念和异同

7. linalg dialect 的设计理念

8. mlir 中一些概念

9. 写一个图的拓扑排序

LLM

1. 请简单讲讲你了解的推理中常见的优化技术

2. attention 相关问题

Arch

1. 讲讲 gpu 的 SM

C++

Coding

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1. 对 SIMD 硬件的优化和 SIMT 硬件的优化(or codegen) 有什么异同