Проблемы и решения при настройке и работе GPU-ферм - Page 4 - Майнинг - CryptoTalk.Org Jump to content
scar313

Проблемы и решения при настройке и работе GPU-ферм

Recommended Posts

2 hours ago, scar313 said:

в общем убрал разгон на этой карте, 

поработало минут 10, и все.  GPU error

снова отключил карту которая через m2 подключена... 

в общем пока не могу понять ... если одна стоит на m2, работает,  в составе со всеми, не работает...

сейчас чтобы удостоверится, ту карту с райзером которая стояла на переходнике m2,  подключил в обычный порт,  чтобы удостоверится что дело не в карте и не в райзере.  

наблюдаем...

в общем печаль пока , не могу понять в чем дело...

Пока у вас верные решения и подход. Бывают глюки именно с переходниками М2. С чем это связано - не понятно, но симптомы примерно такие, как у вас. Поэтому наблюдаем дальше.

Share this post


Link to post
Share on other sites

В общем на 6 картах работает. 

уже 2,5 часа молотит без проблем. 

Завтра сниму переходник и поставлю его во второй риг взамен того что там стоит, (второй риг работает стабильною)  если начнет глючить, значит переходник сбоит,  если нет, значит материнка не хочет брать 7-ю карту. 

пока такие мысли.. больше ничего на ум не идет, будем пробовать.

Всем спасибо за участие,   ушел спать. завтра продолжим.


 

468x60-19.jpg

Share this post


Link to post
Share on other sites
17 minutes ago, BIGkinder said:

Я посоветовал бы вам поменять материнскую на асус 270z. Она стоит 3500 и без всяких переходников держит 8 карт без проблем. В майнинге танцы с бубном - очень плохой подход к решению вопросов

Совет нормальный но вы не учли, что там сокет может быть другой и тип памяти. В 2017 году была не редкость встретить материнки на DDR3, а ваша материнка это уже DDR4.

Share this post


Link to post
Share on other sites
4 minutes ago, BIGkinder said:

Ну тогда нужен большой, качественный шаманский бубен. Чтоб каждый день бегать вокруг фермы и пытаться заставить ее работать. Я предпочитаю стабильную работу в минимум вмешательствах. Включил и забыл, иногда лишь смотрю логи, что все хорошо

Это да, тут не поспоришь, но я уже предлагал ТС купить просто переходник на 2 pci-e, это не дорогой вариант и может быть вполне более рабочим, чем ковырять через М2 все это дело.

Share this post


Link to post
Share on other sites
1 hour ago, BIGkinder said:

Согласен, должно сработать, но согласитесь, куда лучше если переходников вообще избежать? Они обычно китайские все, и иногда один ломается и отваливаются все карты разом, потом ковыряйся ищи, что где сломалось. Это сразу на взгляд не определить

Конечно, это так же как и в электрике, чем меньше других переходников и лишних соединений, то тем лучше и стабильней все работает. Поэтому тоже рекомендую переходник только в самую последнюю очередь.

Share this post


Link to post
Share on other sites
7 hours ago, scar313 said:

В общем на 6 картах работает.

Можно попробовать отключить в биосе звук, встройку и прочую лишнюю белиберду. А лог конечно странный, из него понятно только то что все карты разом начинают выдавать нулевую скорость.


Лучшие курсы BTC-RUB всегда здесь

Share this post


Link to post
Share on other sites
3 hours ago, Solo_miner said:

Можно попробовать отключить в биосе звук, встройку и прочую лишнюю белиберду. А лог конечно странный, из него понятно только то что все карты разом начинают выдавать нулевую скорость.

Не ну по логу там "сторожевой пес" выскакие с Hb ошибкой. Обычно это переразгоны и ошибки оборудования. В плане ТС работают 6 карт с разгоном, то его бы я начал исключать.

Share this post


Link to post
Share on other sites

Ну что, ночь и пол дня прошло... 

ферма на 6 картах работает как часы,   ни одной перезагрузки.. 

Резюме:  все карты и все райзеры абсолютно рабочие,   

проблема кроется или в переходнике m2 to PCI , или в материнке ( сопротивляется против седьмой карты) 

сегодня переходник переставлю на второй риг, который работает стабильно,  и если ошибки полезут там, то это переходник,  а если нет, то надо что то думать про материнку.. ( она на гарантии кстати у меня, и это радует)

 


 

468x60-19.jpg

Share this post


Link to post
Share on other sites
1 hour ago, scar313 said:

Ну что, ночь и пол дня прошло... 

ферма на 6 картах работает как часы,   ни одной перезагрузки.. 

Резюме:  все карты и все райзеры абсолютно рабочие,   

проблема кроется или в переходнике m2 to PCI , или в материнке ( сопротивляется против седьмой карты) 

сегодня переходник переставлю на второй риг, который работает стабильно,  и если ошибки полезут там, то это переходник,  а если нет, то надо что то думать про материнку.. ( она на гарантии кстати у меня, и это радует)

 

А тут на модель материнки бы еще посмотреть. Может ее реально стоит просто продат да и купить что советовали чуть выше? А так если время не жмет, то просто закажите себе переходник с 1 pcie на 2. Вот и все. Но так-то надо еще помониторить риг.

Share this post


Link to post
Share on other sites
3 hours ago, Кукуруза said:

А тут на модель материнки бы еще посмотреть.

Материнка GIGABYTE Z170-GAMING K3

3 hours ago, Кукуруза said:

Но так-то надо еще помониторить риг.

Мониторю с 6-ю картами.  

Останавливал на 10 минут, снял переходник M2,  запустил снова, работает пока без перезагрузок, уже 2 часа.

.

Переходник M2 (который снял)  поставил на второй риг, взамен того что там установлен был,  ( второй риг работает без перебоев вообще.)   заодно весь второй риг продул от пыли, обслужил так сказать.  

Сейчас точно понятно станет, переходник это козлит или нет. 

Все запущено, наблюдаем.

Делаем ставки господа,  переходник или нет виноват ??

Edited by scar313

 

468x60-19.jpg

Share this post


Link to post
Share on other sites

Старые логи тут решил посмотреть, на предмет ошибок

Вопрос к знающим: 

Что в файле лога значат строчки:

20:23:32:949    1e08    NVML: cannot get fan speed, error 999 (an internal driver error occurred)

И вот такие строки:

20:15:10:472    1f5c    gpu #0 dt 14.11 (6%, good)
20:15:10:473    1f5c    gpu #3 dt 9.11 (4%, good)

вот такой вариант:

1f5c    gpu #1 dt 1482.13 (591%, bad)

 

 


 

468x60-19.jpg

Share this post


Link to post
Share on other sites
53 minutes ago, scar313 said:

20:23:32:949    1e08    NVML: cannot get fan speed, error 999 (an internal driver error occurred)

Смею предположить, что проблема в кривых драйверах, которые не могут отследить скорость вращения кулеров по тахометру встроенному.

Edited by Pyatka

Share this post


Link to post
Share on other sites
3 hours ago, scar313 said:

Материнка GIGABYTE Z170-GAMING K3

Мониторю с 6-ю картами.  

Останавливал на 10 минут, снял переходник M2,  запустил снова, работает пока без перезагрузок, уже 2 часа.

.

Переходник M2 (который снял)  поставил на второй риг, взамен того что там установлен был,  ( второй риг работает без перебоев вообще.)   заодно весь второй риг продул от пыли, обслужил так сказать.  

Сейчас точно понятно станет, переходник это козлит или нет. 

Все запущено, наблюдаем.

Делаем ставки господа,  переходник или нет виноват ??

Да, если выпады именно с переходником, то виноват он, тут пока это главный фактор получается.

7 minutes ago, Pyatka said:

Смею предположить, что проблема в кривых драйверах, которые не могут отследить скорость вращения кулеров по тахометру встроенному.

Это я тоже так предполагаю, что может быть и возможно опять же связано с переходником и срабатыванием пса.

Share this post


Link to post
Share on other sites
3 hours ago, scar313 said:

Переходник M2 (который снял)  поставил на второй риг, взамен того что там установлен был,  ( второй риг работает без перебоев вообще.)   заодно весь второй риг продул от пыли, обслужил так сказать.  

Сейчас точно понятно станет, переходник это козлит или нет. 

Все запущено, наблюдаем.

3,5 часа работает уже.  все как часы. 

делаю вывод, что дело  не в переходнике. 

Завтра снесу напрочь винду, и поставлю все с нуля. в том числе и драйвера с дисков, которые с картами были.. 

после этого запущу на 6 картах, откатаю сутки,   потом добавлю 7-ю, поставив 100% рабочий переходник M2 ,   посмотрим поможет или нет.  

второй вариант, попробую на HiveOS запустить, и сравнить как будет работать

предварительный вывод:  материнка почему-то не хочет работать с портом M2,     почему - не понимаю пока.

Edited by scar313

 

468x60-19.jpg

Share this post


Link to post
Share on other sites

Вопрос есть по теме: 

подскажите где можно найти мануал по тому как логи читать у клеймора? 

А то смотрю , и мало что понятно , хочется разобраться 

заранее спасибо за ответы 

 

Share this post


Link to post
Share on other sites
1 hour ago, Anton171 said:

Вопрос есть по теме: 

подскажите где можно найти мануал по тому как логи читать у клеймора? 

А то смотрю , и мало что понятно , хочется разобраться 

заранее спасибо за ответы 

 

Как такового мануала там нет. Можно смотреть часть информации только на https://bitcointalk.org/index.php?topic=1433925.0  А так там многие ошибки имеют банальный перевод. Ну и Readme.txt никто не отменял.

Edited by Кукуруза

Share this post


Link to post
Share on other sites
3 minutes ago, Кукуруза said:

Как такового мануала там нет. Можно смотреть часть информации только на https://bitcointalk.org/index.php?topic=1433925.0  А так там многие ошибки имеют банальный перевод. Ну и Readme.txt никто не отменял.

Ну некоторые можно понять переводом, а многие параметры скрыты за аббревиатурами, которые сходу не очень понятны. 

За ответ спасибо ссылки поизучаю 

Share this post


Link to post
Share on other sites
6 hours ago, Anton171 said:

многие параметры скрыты за аббревиатурами, которые сходу не очень понятны. 

А какие, например?

Переводить английский не надо, его нужно просто читать. Это не сложно и даже в школе ему учат везде практически.

Share this post


Link to post
Share on other sites
4 hours ago, geezer said:

Переводить английский не надо, его нужно просто читать. Это не сложно и даже в школе ему учат везде практически.

Если вам не сложно, просьба относиться к вопросам как минимум с пониманием,   не все владеют английским на должном уровне, 

по теме сбоев в работе фермы: 

вчера на ночь изменил параметры работы на следующие:

PL уменьшил до 85

CoreClock -20

MemoryClock 490

Ферма на 6 картах проработала до 8 утра, и выдала GPU Error

после перезапуска проработала 2 часа, и опять тоже самое GPU Error

Логи тут:

https://yadi.sk/d/81VA-kiw6CEJIg

https://yadi.sk/d/e-q8KrIw9WOoOA

после этого вернул параметры:

PL 87

CoreClock -90

MemoryClock 490

работает уже 4 часа.. пока не слетает. 

 

есть какие-то мысли в чем проблема? 

 

по поводу второго рига, куда я переставил переходник M2 с "больной" фермы  - работает как часы уже 20 часов.

 


 

468x60-19.jpg

Share this post


Link to post
Share on other sites
12 minutes ago, scar313 said:

Если вам не сложно, просьба относиться к вопросам как минимум с пониманием,   не все владеют английским на должном уровне, 

по теме сбоев в работе фермы: 

вчера на ночь изменил параметры работы на следующие:

 

Можно пойти методом тыка в данном формате. Проходимся ластиком по все контактам у карт и переходников. Драйвера уже сносили с майнером на свежеустановленные? И потом делаем PL на карте, что стоит в переходнике 100, в других оставляем на те же, допустим 85. Если ребутается, делаем PL 110 и смотрим тест. Какой там блок питания сейчас?

Share this post


Link to post
Share on other sites
3 minutes ago, Кукуруза said:

Какой там блок питания сейчас?

Блок питания Chieftec 1450

4 minutes ago, Кукуруза said:

Драйвера уже сносили с майнером на свежеустановленные?

Сегодня по плану снос винды под корень, и полная переустановка дров . 

Еще хочу такой финт прокрутить: 

сниму сейчас все 7 карт с райзерами с проблемной фермы и поставлю их на ту что работает как часы,   тем самым хочу уже окончательно исключить карты и райзеры из списка возможных источников проблем.

проверять так хочу не меньше суток. 

а те что стоят на рабочей, поставлю на проблемную,   и посмотрим что выйдет из этого.. 


 

468x60-19.jpg

Share this post


Link to post
Share on other sites
6 minutes ago, scar313 said:

Блок питания Chieftec 1450

Сегодня по плану снос винды под корень, и полная переустановка дров . 

Еще хочу такой финт прокрутить: 

сниму сейчас все 7 карт с райзерами с проблемной фермы и поставлю их на ту что работает как часы,   тем самым хочу уже окончательно исключить карты и райзеры из списка возможных источников проблем.

проверять так хочу не меньше суток. 

а те что стоят на рабочей, поставлю на проблемную,   и посмотрим что выйдет из этого.. 

Это координальный вариант и может сработать в итоге. А так, если время есть, то тогда давайте в этом формате вы поставите не винду, а потратите чуть больше времени и поставить HIVE OS? Это будет отличный вариант, там только разобраться и вы поймете насколько это удобно.

Share this post


Link to post
Share on other sites
1 minute ago, Кукуруза said:

потратите чуть больше времени и поставить HIVE OS? Это будет отличный вариант, там только разобраться и вы поймете насколько это удобно

HiveOS уже залит на флешку, осталось настроить,   

как альтернативный вариант его тоже рассматриваю,   да и если он себя покажет хорошо, то может обе фермы на него и переведу... 

но и с Виндой тоже хочется добиться результата )))  уже спортивный интерес проснулся..


 

468x60-19.jpg

Share this post


Link to post
Share on other sites
52 minutes ago, Кукуруза said:

поставить HIVE OS? Это будет отличный вариант, там только разобраться и вы поймете насколько это удобно.

Запустил,  понаблюдаю, что из этого выйдет. 

сейчас показатели такие: 

 

Гляньте, все ли верно настроил?

Хайв.jpg


 

468x60-19.jpg

Share this post


Link to post
Share on other sites
1 hour ago, scar313 said:

HiveOS уже залит на флешку, осталось настроить,   

как альтернативный вариант его тоже рассматриваю,   да и если он себя покажет хорошо, то может обе фермы на него и переведу... 

но и с Виндой тоже хочется добиться результата )))  уже спортивный интерес проснулся..

Да нет, тут можно и без спортивного интереса. Лишь бы проблем не было в итоге. Что там скриншоте я не виду, к сожалению, форум не дает его посмотреть. Там просто, логин, пароль. Вбили в систему, подключились к интернету и потом все через сайт хайва.

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.


  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...