Voice and vision staat voor de combinatie van spraakherkenningstechnologie en visuele assistentiesystemen. Hierbij krijgt de medewerker extra visuele informatie aangeboden via een slim apparaat ter ondersteuning van het spraakgestuurde dialoog. Net als bij de pick-by-vision-methode kan dit gebeuren via databril, of eenvoudigweg via een smartwatch of een display-apparaat dat is bevestigd aan de picktrolley, bijvoorbeeld een tablet. Afhankelijk van het assortiment en de structuur van het magazijn verhoogt pick by vision de procesbetrouwbaarheid aanzienlijk, omdat de gebruiker altijd een compleet overzicht heeft van alle relevante informatie over de te verwerken pickorders.