Nitisha Jain

Senior Research Engineer

出版物

表示方法:

- Llamas on the Web: Memory-Efficient, Performance-Portable, and Multi-Precision LLM Inference with WebGPU
  
  Reese Levine, Rithik Sharma, Nitisha Jain, Abhijit Ramesh, Zheyuan Chen, N. Abbas, James Contini, Tyler Sorensen
  
  May 2026
  
  arXiv | May 2026
  
  Publication

- Llamas on the Web: Memory-Efficient, Performance-Portable, and Multi-Precision LLM Inference with WebGPU
  
  Reese Levine, Rithik Sharma, Nitisha Jain, Abhijit Ramesh, Zheyuan Chen, N. Abbas, James Contini, Tyler Sorensen
  
  May 2026
  
  arXiv | May 2026
  
  Publication
- Llamas on the Web: Memory-Efficient, Performance-Portable, and Multi-Precision LLM Inference with WebGPU
  
  Reese Levine, Rithik Sharma, Nitisha Jain, Abhijit Ramesh, Zheyuan Chen, N. Abbas, James Contini, Tyler Sorensen
  
  May 2026
  
  arXiv | May 2026
  
  Publication

- Llamas on the Web: Memory-Efficient, Performance-Portable, and Multi-Precision LLM Inference with WebGPU
  
  Reese Levine, Rithik Sharma, Nitisha Jain, Abhijit Ramesh, Zheyuan Chen, N. Abbas, James Contini, Tyler Sorensen
  
  May 2026
  
  arXiv | May 2026
  
  Publication

プライバシーに関する選択