Ke Wang

Papers: 31

Cite

Notes

Only stored in your browser.

Attribution

Affiliations & profile: Semantic Scholar

Attribution policy →

31papers

Authored papers

GLM-5: from Vibe Coding to Agentic Engineering

arXiv 2026

2026

FullStack-Agent: Enhancing Agentic Full-Stack Web Coding via Development-Oriented Testing and Repository Back-Translation

arXiv 2026

2026

SlidesGen-Bench: Evaluating Slides Generation via Computational and Quantitative Metrics

arXiv 2026

2026

GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models

arXiv 2025

2025

Seed1.5-VL Technical Report

arXiv 2025

2025

WebGen-Bench: Evaluating LLMs on Generating Interactive and Functional Websites from Scratch

arXiv 2025

2025

SG-Reg: Generalizable and Efficient Scene Graph Registration

arXiv 2025

2025

MathCoder-VL: Bridging Vision and Code for Enhanced Multimodal Mathematical Reasoning

arXiv 2025

2025

WideSearch: Benchmarking Agentic Broad Info-Seeking

arXiv 2025

2025

CodePlot-CoT: Mathematical Visual Reasoning by Thinking with Code-Driven Images

arXiv 2025

2025

MathCanvas: Intrinsic Visual Chain-of-Thought for Multimodal Mathematical Reasoning

arXiv 2025

2025

OmniVideoBench: Towards Audio-Visual Understanding Evaluation for Omni MLLMs

arXiv 2025

2025

VoiceAssistant-Eval: Benchmarking AI Assistants across Listening, Speaking, and Viewing

arXiv 2025

2025

Adaptive Markup Language Generation for Contextually-Grounded Visual Document Understanding

CVPR 2025 1

2025

WebGen-Agent: Enhancing Interactive Website Generation with Multi-Level Feedback and Step-Level Reinforcement Learning

arXiv 2025

2025

EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning

arXiv 2025

2025

VeriCoder: Enhancing LLM-Based RTL Code Generation through Functional Correctness Validation

arXiv 2025

2025

DAComp: Benchmarking Data Agents across the Full Data Intelligence Lifecycle

arXiv 2025

2025

FM-Fusion: Instance-aware Semantic Mapping Boosted by Vision-Language Foundation Models

arXiv 2024

2024

MathCoder2: Better Math Reasoning from Continued Pretraining on Model-translated Mathematical Code

arXiv 2024

2024

A Survey on Hallucination in Large Vision-Language Models

arXiv 2024

2024

LiNeS: Post-training Layer Scaling Prevents Forgetting and Enhances Model Merging

arXiv 2024

2024

Enhancing the General Agent Capabilities of Low-Parameter LLMs through Tuning and Multi-Branch Reasoning

arXiv 2024

2024

Watch Every Step! LLM Agent Learning via Iterative Step-Level Process Refinement

arXiv 2024

2024

Localizing Task Information for Improved Model Merging and Compression

arXiv 2024

2024

SAM Decoding: Speculative Decoding via Suffix Automaton

arXiv 2024

2024

Semantically-Shifted Incremental Adapter-Tuning is A Continual ViTransformer

CVPR 2024 1

2024

Step-Controlled DPO: Leveraging Stepwise Error for Enhanced Mathematical Reasoning

arXiv 2024

2024

SwinFace: A Multi-task Transformer for Face Recognition, Expression Recognition, Age Estimation and Attribute Estimation

arXiv 2023

2023

OFVL-MS: Once for Visual Localization across Multiple Indoor Scenes

ICCV 2023 1

2023

Aligning Logits Generatively for Principled Black-Box Knowledge Distillation

CVPR 2024 1

2022

Affiliations

No known affiliations.

Frequent co-authors

from 31 papers

Hongsheng Li

Houxing Ren

Zimu Lu

Mingjie Zhan

Aojun Zhou

Weikang Shi

Yunqiao Yang

Junting Pan

Yongbin Li

Yuchuan Wu