IA se tornando mais proeminente no design de chips

IA se tornando mais proeminente no design de chips

Nó Fonte: 2545337

A Semiconductor Engineering sentou-se para falar sobre o papel da IA ​​no gerenciamento de dados e na melhoria de projetos, e seu papel crescente na descoberta de caminhos e na prevenção da corrupção silenciosa de dados, com Michael Jackson, vice-presidente corporativo de P&D da Cadence; Joel Sumner, vice-presidente de semicondutores e engenharia eletrônica da National Instruments; Grace Yu, gerente de produto e engenharia da Meta, e David Pan, professor do Departamento de Engenharia Elétrica e de Computação da Universidade do Texas em Austin. O que se segue são trechos dessa conversa, que foi realizada na frente de uma platéia ao vivo na DesignCon. A primeira parte desta discussão é SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

SE: Todos e tudo estão coletando uma enorme quantidade de dados atualmente. Onde armazenamos e por quanto tempo? E como determinamos o que é relevante?

Sumner: onde estamos vendo a IA aplicada primeiro são os locais que possuem armazenamento de dados muito grande e robusto. Temos a sorte de a infraestrutura de teste de produção de semicondutores ser executada em um formato padrão, permitindo que você a coloque nesses bancos de dados realmente enormes com boa marcação, que é o que é aprovado e o que é reprovado. Isso nos deu um trampolim para pesquisar essas coisas e usá-las como prova, porque tem aplicabilidade em muitos outros setores para validação ou qualquer coisa automatizada. Mas esses armazenamentos de dados realmente não existem de maneira padrão hoje em muitos lugares. Onde existe é onde estamos vendo a adoção.

SE: Todos esses dados serão armazenados em um só lugar? E como esses dados serão usados ​​daqui para frente?

Sumner: Vai acabar sendo distribuído por vários motivos. Uma delas é que é apenas prático. Em segundo lugar, há dados do cliente envolvidos. Portanto, você não pode necessariamente excluir tudo. Por exemplo, estamos executando algoritmos de IA em vários locais da cadeia de design. Estamos executando-os na nuvem, mas também perto de onde os dados são adquiridos. Isso requer que os dados sejam distribuídos. Mas, ao mesmo tempo, você realmente precisa de todos os dados que deseja examinar para treinar o modelo para estar em um só lugar e facilmente acessível.

Panela: E você pode usar esses dados para ajudá-lo a tomar melhores decisões. Por exemplo, podemos gerar dezenas de milhares ou layouts diferentes e depois fazer a simulação, a extração e o layout final. Isso é complementar para os especialistas em design.

Jackson: Do ponto de vista da EDA, a criação de novos dados geralmente pode ser feita permutando ou criando layouts aleatoriamente. Então você pode criar problemas sinteticamente, e isso pode ser outra fonte de dados. Essa é uma das vantagens da EDA.

SE: Dado o volume de dados, tudo isso vai ser feito na nuvem ou será feito localmente? Estamos falando de conjuntos de dados muito maiores, que exigem muito mais potência computacional.

Jackson: Isso vai depender da empresa. Estou trabalhando com design de placa de circuito impresso e estamos trabalhando com IA, e há muitos recursos de computação na nuvem que permitem a IA. As pequenas empresas podem estar bem em manter seus dados na nuvem, mas as grandes empresas vão querer executá-los em suas nuvens privadas.

Panela: A privacidade dos dados é definitivamente uma grande preocupação. Essa é uma área importante em termos de aprendizado de máquina. Mas você não precisa passar seus dados. Você pode criptografá-lo e, em seguida, fazer a computação homomórfica. A computação segura é uma área de pesquisa emergente. Portanto, sem compartilhar dados, você ainda pode verificá-los.

Yu: Depende de que tipo de dados estamos falando. Temos uma política muito rígida sobre a privacidade do cliente. Somente as pessoas que precisam acessar esses dados podem fazer isso. Cada funcionário que ingressa na Meta passa por treinamento anual sobre privacidade de dados. Para dados de design, depende do projeto. Alguns dados nós armazenamos no servidor local, e utilizamos a nuvem para nosso acesso de big data, e também para simulação e validação. Então é caso a caso.

SE: À medida que o hardware envelhece, como isso afeta o comportamento da IA?

Sumner: Quando se trata de envelhecer, é importante que você fale sobre o ambiente em que a IA está sendo executada. Não são os algoritmos que vemos a idade. São os dados de treinamento. Portanto, você o treinou em um conjunto específico de dados de fabricação e esses dados de fabricação foram obtidos de um ambiente de fabricação específico. E então, com o tempo, as coisas mudam. Você verá uma das duas situações. Um é que todo o sistema se desvia e, portanto, a IA precisa detectar isso agora, porque todo o sistema se afastou o suficiente de seus dados de treinamento iniciais e precisa ser treinado novamente. A segunda situação é quando algum dispositivo aparece com algo tão diferente do que já viu antes que o algoritmo diz: 'Espere, espere, não sou a melhor resposta aqui. Agora preciso consultar um humano porque isso está muito longe.' Ambos são exemplos de decadência no sistema. A atualização constante é necessária.

Jackson: Concordo. A reciclagem constante é necessária para lidar com o envelhecimento. Mas, à medida que o software é exposto a um conjunto de treinamento cada vez maior, ele também evolui e se torna mais eficaz.

Panela: A reciclagem do zero pode ser muito cara. Em vez disso, você pode fazer o aprendizado de transferência. Por exemplo, alguns anos atrás, trabalhamos na detecção de pontos de acesso. Quando você detecta algo em 14 nm e migra para 7 nm, não precisa começar do zero. Você pode usar uma arquitetura de aprendizado de máquina original, mas pode começar de algum lugar no meio.

SE: Um dos grandes problemas hoje é a corrupção silenciosa de dados, que se deve a defeitos de hardware. Podemos rastrear isso por meio de sistemas usando IA e identificar o problema e a causa exata?

Yu: AI é como qualquer outra ferramenta. Não é perfeito. Mas a maneira de evitar esses problemas é ter um humano no circuito para fazer testes de validação com frequência, talvez usando um cenário conhecido para executar a IA e o computador para ver se obtemos o resultado esperado. Usando abordagens simples como essa, você pode identificar o problema, identificar a incompatibilidade e mergulhar fundo nessas áreas. Os engenheiros não são perfeitos e a IA não é perfeita. Para melhorar constantemente, você deve verificar novamente e cruzar com mais frequência para evitar esses tipos de problemas.

Jackson: Estamos investindo pesadamente em toda a área de verificação no que se refere à aceleração ou assistência às pessoas no projeto e na depuração de problemas funcionais nesses projetos. Definitivamente, vemos isso como um ponto ideal e estamos canalizando muita energia para a IA.

SE: Isso é feito apenas no estágio de design ou durante todo o ciclo de vida do chip?

Jackson: Até certo ponto, é o ciclo de vida do chip. É o teste dele, a implantação e a depuração dos problemas

Sumner: essa tecnologia funciona bem para coisas que exigem quantidades exaustivas de pessoas para participar e descobrir algo, e para poder fazer isso enquanto remove muito do trabalho mundano, mas difícil. Em última análise, o objetivo é que você possa ir para casa à noite, voltar pela manhã e obter um relatório que diga: 'Passei por gigabytes, ou mais, de dados e aqui está o lugar onde você deve procurar. E não estou dizendo que há um problema, mas pode haver, então dê uma olhada nisso. É pegar uma agulha no palheiro e transformá-los em esforços focados em como você acaba lidando com um problema em seu produto. Também pode ser aplicado a como tornamos nossos algoritmos mais confiáveis, criando uma sensação de que posso confiar nisso porque foi testado e sei que vem de uma fonte respeitável.

Panela: Existem maneiras formais de verificar algo e há simulação. Em última análise, precisamos de ambos para uma boa cobertura. Idealmente, queremos ser capazes de identificar essas falhas estranhas que causam corrupção silenciosa de dados no início do processo. Esse é um tópico de pesquisa bastante ativo hoje.

Carimbo de hora:

Mais de Semi Engenharia